
25
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 현대오토에버 데이터플랫폼기술팀이 Amazon Bedrock과 LangGraph를 활용해 빅데이터 클러스터 장애 대응 자동화 에이전트를 구축한 사례를 소개합니다.
핵심 요약
- 목표: MTTA 단축, 진단 품질 표준화, 인시던트 지식 자산화
- 아키텍처: VDI Agent와 Main Agent Server 분리, LangGraph로 상태 기반 워크플로우 오케스트레이션
- 로그 분석: Amazon OpenSearch로 집계하여 SearchIntent 생성 후 Triage→Deep Summarize로 EvidencePack 생성
- RCA: Amazon Bedrock 멀티모델로 병렬 RCA 실행, 각 RCA의 반증 생성 후 Reflector로 교차 검증
- 운영 원칙: Human-in-the-Loop 복구 승인, 비파괴적 진단 명령만 허용, PostgresSaver 체크포인트로 내결함성 확보

