AI가 전사 알림을 두 번 죽이다
데브옵스
AI가 전사 알림을 두 번 죽이다
두줄요약
120일 동안 AI 에이전트 실수 15건을 guardrail로 바꾸며 인프라 방어선을 강화한 기록입니다.\nCLAUDE.md와 Memory를 겹쳐 세션 한계를 보완하고, 가용성을 99.981%까지 끌어올렸습니다.
핵심 내용
- 인프라팀이 120일 동안 Claude Code를 활용하며 겪은 AI 에이전트 실수와 이를 guardrail로 바꿔간 기록
- Datadog Slack Integration, CloudFront origin 전환, WAF 로그 쿼리, bot 메시지 삭제 등 실수 유형별 사고와 재발 방지 정책 축적
- CLAUDE.md, Memory, 사고 이력을 겹쳐 두는 방식으로 세션 밖에서도 유지되는 방어선을 구성
- 모니터 75개에서 191개로 확대하고 가용성 99.963%에서 99.981%로 개선한 운영 성과
적용해볼 점
- 치명적 작업은 문서 지식만 믿지 말고 side effect와 영향 범위를 체크리스트로 고정
- 계산, 시간 변환, 제약 확인은 LLM 대신 코드와 정책으로 강제
- 세션형 AI의 한계를 보완하려면 프로젝트 정책, 영구 메모, 사고 이력을 함께 운영
