

야놀자의 Strands SDK와 Bedrock AgentCore를 활용한 AIOps Agent 구축 사례
야놀자가 Bedrock AgentCore와 Strands SDK로 AIOps 멀티 에이전트를 구축한 사례를 소개했습니다. 반복 운영 업무를 자동화해 수동 업무 시간과 MTTR을 줄이고 조직 내 AI 역량을 내재화했습니다.


야놀자가 Bedrock AgentCore와 Strands SDK로 AIOps 멀티 에이전트를 구축한 사례를 소개했습니다. 반복 운영 업무를 자동화해 수동 업무 시간과 MTTR을 줄이고 조직 내 AI 역량을 내재화했습니다.


프로덕션급 Multi-Agent 시스템에서 Context Window 한계를 넘기 위한 4계층 Context Engineering 기법을 소개했습니다. 멀티 에이전트 격리, 프롬프트 제어, 파일 외부화, 검증과 안전장치로 품질과 비용을 함께 다뤘습니다.


AWS에서 데이터 거버넌스를 구현하기 위한 기반 전략과 태깅, 분류 체계를 정리했습니다. 조직 준비와 자동화 중심의 운영 지표까지 함께 제시했습니다.

EKS 애플리케이션 로그를 Athena와 Amazon Bedrock으로 자동 분석하는 파이프라인을 구축했습니다. 수작업 로그 분석을 줄이고 장애 원인과 패턴을 빠르게 파악하도록 구성했습니다.


기존 Java/Spring 코드에서 그래프 스키마와 비즈니스 규칙을 추출해 spec.json을 만들고 GraphRAG를 구현하는 방법을 소개했습니다. Neptune Analytics와 Bedrock Knowledge Bases로 관계 기반 질의를 처리하는 흐름을 설명했습니다.


프로덕션 Multi-Agent 시스템이 겪는 실행 흐름, 검증, 보안, 운영 문제를 Deep Insight 아키텍처로 정리했습니다. Strands Agents SDK와 Bedrock, Fargate 기반 설계로 실전 배포와 운영 방법을 소개했습니다.


OWASP의 LLM Top 10과 Agentic Top 10을 바탕으로 GenAI 보안 점검용 100개 체크리스트를 정리했습니다. 프롬프트, 데이터, 에이전트, 인프라까지 계층별 대응과 AWS 적용 시 주의사항을 함께 제시했습니다.


분산 트레이닝에서 GPU 간 통신 오버헤드가 큰 병목이므로 인터커넥트 선택이 중요하다고 설명했습니다. AWS는 클라우드 환경의 멀티테넌시와 운영 효율성 때문에 EFA를 선택했다고 정리했습니다.


AWS와 NVIDIA가 자율주행 3.0을 위한 End-to-End Physical AI 데이터 파이프라인을 소개했습니다. 센서 수집부터 큐레이션, 복원, 학습, 시뮬레이션 검증까지의 반복 루프를 정리했습니다.


TwelveLabs Marengo와 AWS 서비스를 결합해 VoD 영상 분석 파이프라인을 구성하는 방법을 설명했습니다. 업로드 즉시 처리, 배치, 대규모 병렬 처리에 맞는 아키텍처 선택 기준도 정리했습니다.

Host Level 카오스 엔지니어링으로 인프라 장애를 직접 재현하고 QA 관점에서 고객 경험과 데이터 정합성을 검증했습니다. 이를 통해 알림 체계, 자동 복구, 정기 테스트 프로세스를 강화했습니다.

라포랩스 Backend Chapter Leader의 커리어와 팀 운영 방식, AI Native 전환 방향을 소개했습니다. 시니어 엔지니어의 역할을 팀 임팩트와 리더십 중심으로 설명했습니다.