Karrot’s Journey to CDC with MongoDB Karrot’s Journey to CDC with MongoDB 당근마켓 Backend 2025년 12월 9일 41 BigQuery Spark MongoDB CDC Flink AI 요약 이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다. 이 게시물은 Karrot가 MongoDB CDC를 도입해 BigQuery로 데이터를 안정적으로 적재한 과정과 설계 및 기술 선택 이유를 설명문제와 목표대용량·자주 변경되는 컬렉션의 덤프 부담 완화, DB CPU 사용률 60% 이하 안정화, 2시간 SLO 준수기술 선택Flink CDC 채택 이유로 MongoDB Change Stream 지원, 안정적 체크포인트·Exactly-Once 보장, 추출·변환·적재를 하나의 파이프라인으로 처리, 수평 확장성 제공설계 요약초기 스냅샷은 Spark로 처리하고 이후 CDC 이벤트를 시간별 배치로 병합하여 재처리 용이성 및 아이디empotency 확보 연관 게시글 매번 다 퍼올 필요 없잖아? 당근의 MongoDB CDC 구축기 당근마켓 • 2025년 12월 8일 161 Kafka와 ETL을 활용해 대용량 데이터 마이그레이션하기 라인 • 2024년 8월 26일 50 컬리의 BigQuery 도입기 - 2부 마켓컬리 • 2023년 2월 17일 27 뒤로가기 공유하기 원문 보기