AI 서버 모니터링 자동화: 반복적인 업무를 줄이고, 놓치던 인사이트를 얻다.
Datadog 모니터링 분석을 Gemini로 자동화해 주간 작업 시간을 1시간에서 5분으로 줄였습니다. 다만 이미지 분석과 비즈니스 맥락 부족으로 인한 한계는 API 데이터와 검증 과정으로 보완했습니다.
Datadog 모니터링 분석을 Gemini로 자동화해 주간 작업 시간을 1시간에서 5분으로 줄였습니다. 다만 이미지 분석과 비즈니스 맥락 부족으로 인한 한계는 API 데이터와 검증 과정으로 보완했습니다.

카카오의 대규모 서비스 운영에서 분산 추적 기반 AI 운영 생태계를 다룬 글입니다. 다만 본문 내용이 부족해 구체적인 구현과 사례는 확인하기 어려웠습니다.


검색서비스팀의 SCAR 모니터링 시스템 고도화와 전체 구조를 소개했습니다. 기존 로그 기반 방식의 한계를 짚고, 수집·집계·시각화 분리와 품질 지표 확장을 다뤘습니다.

X

X
![[에이닷 4.0 QE 여정3] LLM 품질 평가의 진화: SPeCTRA 2.0 톺아보기](https://devocean.sk.com/thumnail/2025/9/2/18a05ae6f560f5663e7ef7428eb491c7362f850ffff2113554dc7f15d3f4db6f.png)

에이닷 4.0 개편에 맞춰 SPeCTRA 2.0이 API 중심 Web 평가 도구로 진화했습니다. 내부 로그와 Memory까지 함께 검증해 품질 평가의 신뢰성과 속도를 높였습니다.

체험단 활동목록 조회 API의 10초 타임아웃을 대용량 데이터에 맞는 인덱스와 쿼리 분리로 해결했습니다. 조회 구조를 바꿔 p99 지연시간을 20ms 이하로 낮췄습니다.

Amazon Bedrock 기반 AI Agent 솔루션 에이블의 AWS Marketplace 등록 소식입니다. 별도 설치 없이 클라우드에서 AI 에이전트를 생성·운영할 수 있고, 기업 데이터 벡터화와 지식 검색 기능을 제공합니다.


기업을 노리는 보안사고가 랜섬웨어와 개인정보 유출 등으로 계속 확대되고 있습니다. 상시 모니터링과 신속 대응이 중요하며, 외부 보안관제가 현실적인 대안으로 제시되었습니다.

서비스의 건강을 수치로 보기 위해 SLI와 SLO를 정의하고 운영하는 방법을 소개했습니다. 29CM 사례를 통해 지표 설계, 모니터링, 지속 개선 체계를 설명했습니다.

페이스페이 사일로가 얼굴 인증의 어색함을 줄이기 위해 반복 노출과 즐거운 체험형 이벤트, 공공 디바이스에 맞는 UX를 고민한 과정을 다뤘습니다. 에러 메시지보다 사용자의 시선 위치를 고려한 안내 방식과 결제·입장 경험 단순화 방향도 소개했습니다.

LY Corporation 사내 해커톤 Hack Day 2025 참가 후기를 전했습니다. 자유 주제 개발과 90초 발표, 글로벌 네트워킹과 AI 기반 프로덕트 경험을 공유했습니다.