12.5억 개의 시계열과 555조 개의 데이터포인트를 다루는 VictoriaMetrics 아키텍처와 무중단 장비 전환

10
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 VictoriaMetrics를 사용해 네이버 검색의 대규모 시계열 데이터를 안정적으로 수집·저장·조회하고 무중단 장비 전환을 수행한 경험을 공유하는 글입니다.

핵심 지표

  • 활성 시계열 12.5억 개, 전체 데이터포인트 555조 개, 실제 디스크 사용량 약 510TB, 포인트당 저장 크기 0.92바이트

아키텍처

  • vminsert→vmstorage→vmselect 구조와 Hot/Warm 2계층으로 SSD/HDD 분리하여 성능과 비용 균형

수집·분기

  • vmagent의 이중 쓰기(dual write)로 Hot과 Warm에 동시에 전송하고 시간 범위에 따라 조회 계층 분기

무중단 전환

  • Hot은 역순 노드 추가로 랑데부 해싱과 복제 부하 분산, Warm은 vmbackup/vmrestore로 스냅샷·증분 복사 기반 마이그레이션

메모리 한계 대응

  • vmstorage RAM을 128GB에서 512GB로 증설하고 메인테이너 권장 50% RSS 여유 확보로 OOM·쿼리 지연 위험 완화

연관 게시글