당근 데이터 디스커버리 구축기: DataHub와 DataWiki로 여는 데이터 탐색의 첫걸음 - 당근마켓 | Velopers

당근 데이터 디스커버리 구축기: DataHub와 DataWiki로 여는 데이터 탐색의 첫걸음

2025년 7월 17일

229

AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

당근 데이터 디스커버리 구축기

이 게시물은 당근에서 DataHub와 DataWiki를 활용해 데이터 탐색과 관리 체계를 구축한 과정을 설명합니다.

첫 번째 솔루션: DataHub

Kafka 기반 실시간 스트리밍으로 메타데이터 자동 수집
MySQL, Elasticsearch, 그래프 DB를 통한 저장, 검색, 관계 탐색 지원
Airflow 활용한 메타데이터 업데이트 자동화 및 신선도 모니터링
전사 구성원에게 Editor 권한 부여해 데이터 민주화 실현

두 번째 솔루션: DataWiki

노션 기반의 데이터 위키로 비즈니스 로직, 쿼리 예시 등 맥락 제공
도메인 중심 탐색 구조와 템플릿 제공으로 참여 허들 낮춤
BigQuery를 SSOT로 지정해 DataHub와 연계, 메타데이터 일관성 확보

현재와 미래

99% 이상의 데이터 신선도와 신뢰성 확보
플랫폼 분리, 관리 어려움, 커스터마이징 한계 등 과제 존재
대화형 챗봇 인터페이스 등 차세대 데이터 탐색 환경 계획 중

연관 게시글

데이터카탈로그에서 DataHub를 이용하는 방법

데이터카탈로그에서 DataHub를 이용하는 방법

우아한 형제들

우아한 형제들 • 2025년 2월 18일

데이터카탈로그 PM이 ‘데이터 디스커버리’라는 가치를 풀어내는 방법

데이터카탈로그 PM이 ‘데이터 디스커버리’라는 가치를 풀어내는 방법

우아한 형제들

우아한 형제들 • 2025년 2월 13일

당근 데이터 지도를 그리다: 컬럼 레벨 리니지 구축기

당근 데이터 지도를 그리다: 컬럼 레벨 리니지 구축기

당근마켓

당근마켓 • 2025년 12월 4일