12.5억 개의 시계열과 555조 개의 데이터포인트를 다루는 VictoriaMetrics 아키텍처와 무중단 장비 전환
네이버는 VictoriaMetrics로 12.5억 시계열과 555조 데이터포인트를 안정적으로 운영했습니다. Hot/Warm 계층과 역순 노드 추가, vmbackup 기반 마이그레이션으로 무중단 장비 전환을 달성했습니다.

네이버는 VictoriaMetrics로 12.5억 시계열과 555조 데이터포인트를 안정적으로 운영했습니다. Hot/Warm 계층과 역순 노드 추가, vmbackup 기반 마이그레이션으로 무중단 장비 전환을 달성했습니다.
DocumentDB 전환으로 발생한 인덱스 관련 성능 문제를 분석했습니다. partial index, $or+sort, regex→range, hot document 대응을 제시했습니다.
MongoDB Atlas에서 Amazon DocumentDB로 이전하여 IOPS 병목을 해소하고 복제 지연을 크게 줄였습니다. 전환 후 응답속도는 50% 개선되고 인프라 비용은 약 30% 절감했습니다.
김영신 님은 포스타입 비즈니스팀 리드로 플랫폼 지속가능성과 크리에이터 안정적 창작 환경을 책임한다고 했습니다. 데이터 기반 의사결정과 가설-실험-검증의 빠른 반복으로 의미 있는 실험을 늘리는 조직 문화를 강조했습니다.
LLM을 평가자로 만들어 설명 생성의 품질을 자동화하고 디버깅과 데이터 정제에 활용했습니다. 체크리스트 분해, 크리틱 구조화, 리마인더 도입으로 인간 평가자와 약 84%의 일치율을 달성했습니다.
정답 데이터 없는 설명 생성 문제에서 정책 중심 이터레이션으로 설명 품질을 개선했습니다. PM과 엔지니어의 빠른 pass/fail 평가와 critique 반복으로 정책을 수렴하고 LLM Judge로 평가 자동화합니다.
배치 기반 혜택 파이프라인을 Kafka로 전환해 준실시간 반영을 구현했습니다. Redis Pub/Sub과 Aggregation Topic으로 동시성·정합성 문제를 해결했습니다.
LINE 앱에 SLI/SLO를 도입해 CUJ 기반 지표와 현실적 SLO 설정 사례를 공유했습니다. 대시보드와 오류 예산, 온콜을 통해 모니터링과 리소스 배분에 활용합니다.
AWS Bedrock Converse API와 도구를 사용해 멀티 모델 에이전트를 Streamlit과 Lambda로 구현하는 방법을 설명했습니다. 서버리스 연동, 스트리밍 응답 파싱, 도구 호출과 보안·RAG 적용 방식을 다뤘습니다
Codex 플러그인은 Slack·Figma·Notion 등을 한 줄 프롬프트로 통합했습니다. 단계적 도입으로 알림·문서화·리뷰 자동화 효과를 기대합니다.