MRT Public Data Service 개발 — 2
4
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

MRT Public Data Service 개발

이 게시물은 마이리얼트립에서 CDC를 이용해 서비스 DB 데이터를 Kafka Streams와 Druid를 활용해 실시간 집계 및 API 제공하는 Public Data Service(PDS)를 개발한 과정을 설명합니다.

주요 기술 구성

  • Kafka Streams를 이용한 CDC 데이터 처리 및 실시간 스트리밍 연산
  • Druid를 활용한 대용량 이벤트 데이터의 실시간 색인 및 OLAP 분석
  • Helm과 ArgoCD를 통한 배포 및 운영 자동화

시스템 아키텍처 및 운영

  • CDC로 서비스 테이블과 메타데이터 테이블을 수집하고 GlobalKTable을 활용해 스트리밍 조인 수행
  • Druid는 column-oriented 구조와 사전 집계 기능을 통해 효율적인 데이터 저장 및 조회 지원
  • Prometheus와 Grafana로 모니터링 체계 구축

적용 효과

  • BigQuery 사용의 비용과 지연 문제를 해결하며 실시간 후기, 예약 데이터 집계 가능
  • 도시홈 서비스 및 파트너 페이지 등 실서비스에 PDS 활용 확대

연관 게시글