
현대오토에버의 Amazon Bedrock으로 구축한 다중 AI 에이전트: 장애 대응 시간 5분으로 단축하기
현대오토에버가 Amazon Bedrock과 LangGraph로 다중 AI 에이전트를 구성해 장애 대응을 자동화했습니다.\n장애 분석부터 보고서 생성까지를 연결해 대응 시간을 수 시간에서 5분으로 줄였습니다.

현대오토에버가 Amazon Bedrock과 LangGraph로 다중 AI 에이전트를 구성해 장애 대응을 자동화했습니다.\n장애 분석부터 보고서 생성까지를 연결해 대응 시간을 수 시간에서 5분으로 줄였습니다.

Multi-AZ는 가용성을 높이기 위한 기본 구조이고, Multi-Region은 Region 전체 장애에 대비하는 DR 전략입니다.\nDR 설계에서는 RTO와 RPO를 기준으로 복제, 트래픽 전환, 세션 처리를 함께 고려해야 했습니다.

IaC를 인프라를 코드로 관리하는 표준과 방법론으로 설명했습니다. 수동 관리의 문제와 함께 재현성, 버전 관리, 일관성의 가치를 정리했습니다.


딜라이트룸은 EKS Auto Mode로 멀티 클러스터 운영 복잡도를 크게 줄였습니다. 또한 로그 수집과 진단 자동화를 더해 장애 대응력도 높였습니다.


EKS Auto Mode와 Bifrost, Langfuse를 조합해 자체 관리형 Agentic AI 플랫폼을 구축하는 방법을 소개했습니다. 멀티모델 라우팅과 2계층 관측성으로 운영 안정성과 비용 최적화를 함께 확보했습니다.

Kubernetes v1.35 Timbernetes의 주요 기능과 변경점을 정리했습니다. AI 워크로드 지원과 운영 개선, 업그레이드 시 주의사항을 함께 다뤘습니다.
![[코드가 환경을 모르는 구조 4/7] 타임머신 — 시간 축을 교체한다](https://cdn.sanity.io/images/v31psllp/production/6a70f8e2c090762cbd4b1a9d470f573cbc0fc038-1684x1030.png)

HR SaaS에서는 시간이 급여와 연차 결과를 바꾸는 입력이므로 요청 단위로 교체 가능하게 만들었습니다. Clock 포트와 헤더 기반 Adapter, 비동기 컨텍스트 전파, 환경별 활성화로 타임머신을 구현했습니다.


라포랩스가 AWS AI-DLC로 사내 배포 플랫폼 Raploy를 구축한 사례를 공유했습니다. 비개발 직군도 AI와 플랫폼을 통해 배포·운영할 수 있도록 자동화와 관측성을 함께 강화했습니다.

AI를 서비스와 인프라에 어떻게 적용하고 운영할지 다룬 기술 소식 모음입니다. 공공 AI 인프라, 프레임워크 비교, 플랫폼 재설계와 Agent 구축 흐름을 소개했습니다.
![[코드가 환경을 모르는 구조 2/7] 배포 코드가 환경을 모르는 구조](https://flex.team/blog/og/main.jpg)

배포 코드가 환경 이름을 직접 읽지 않도록 Helm values와 GitOps 규율로 분리한 구조를 설명했습니다. Jenkinsfile까지 같은 원칙을 적용해 배포 이력을 Git으로 남기는 방법을 다뤘습니다.


AWS Security Agent로 설계 검토, 코드 리뷰, 침투 테스트를 자동화하는 방법을 소개했습니다. 개발팀과 보안팀의 병목을 줄이고 SDLC 전반에 보안을 통합하는 방향을 제시했습니다.
![[코드가 환경을 모르는 구조 2/7] 배포 코드가 환경을 모르는 구조](https://cdn.sanity.io/images/v31psllp/production/58ae2e178769ca25361200fed07c9ecb06c62d2a-1684x1030.png)

배포 코드를 환경별로 갈라 쓰지 않고, 템플릿과 값의 층을 분리해 환경을 외부에서 주입하는 구조를 설명했습니다. GitOps와 Jenkinsfile에도 같은 규율을 적용해 배포 이력을 Git에 남기는 방법을 다뤘습니다.