현대오토에버의 Amazon Bedrock으로 구축한 빅데이터 클러스터 장애 대응 자동화 에이전트 구축기
25
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 현대오토에버 데이터플랫폼기술팀이 Amazon Bedrock과 LangGraph를 활용해 빅데이터 클러스터 장애 대응 자동화 에이전트를 구축한 사례를 소개합니다.

핵심 요약

  • 목표: MTTA 단축, 진단 품질 표준화, 인시던트 지식 자산화
  • 아키텍처: VDI Agent와 Main Agent Server 분리, LangGraph로 상태 기반 워크플로우 오케스트레이션
  • 로그 분석: Amazon OpenSearch로 집계하여 SearchIntent 생성 후 Triage→Deep Summarize로 EvidencePack 생성
  • RCA: Amazon Bedrock 멀티모델로 병렬 RCA 실행, 각 RCA의 반증 생성 후 Reflector로 교차 검증
  • 운영 원칙: Human-in-the-Loop 복구 승인, 비파괴적 진단 명령만 허용, PostgresSaver 체크포인트로 내결함성 확보

연관 게시글