

Amazon DocumentDB 인덱스 최적화로 미리캔버스의 쿼리 성능을 개선 사례
Amazon DocumentDB 전환 후 발생한 인덱스와 쿼리 성능 문제를 실제 사례로 정리했습니다. explain, profiler, 인덱스 재설계와 쿼리 변경으로 성능을 개선했습니다.


Amazon DocumentDB 전환 후 발생한 인덱스와 쿼리 성능 문제를 실제 사례로 정리했습니다. explain, profiler, 인덱스 재설계와 쿼리 변경으로 성능을 개선했습니다.

채널톡 메인 백엔드 서버의 CI 병목을 단계적으로 분해해 개선한 과정을 정리했습니다. 공유 상태 제거, prepare 분리, 동적 큐와 캐시로 실행 시간을 크게 줄였습니다.

AI가 코드를 빠르게 만들수록 CI 병목과 피드백 속도가 더 중요해졌습니다. 채널톡은 공유 상태 제거와 캐시, 동적 큐로 메인 백엔드 CI를 36.6분에서 15분대까지 줄였습니다.

마이리얼트립이 여행 상품 등록의 수작업 병목을 AI로 자동화한 사례를 공유했습니다.\n번역, 상세 페이지 생성, 카테고리 분류를 묶어 하루 20개 수준을 5,000개 이상으로 늘렸습니다.

Apache Flink와 RocksDB 튜닝으로 광고 Frequency Capping 실시간 집계를 7일 구간까지 확장한 사례를 다루었습니다. 세 개의 Flink 앱으로 분리해 병목을 각각 해결하고 Redis 단일 조회 구조로 단순화했습니다.

여기어때의 통합 알림 플랫폼 NotiHub 설계와 핵심 의사결정을 정리했습니다. Kafka, Redis, HPA, 샤딩으로 안정성과 확장성을 함께 확보했습니다.

알림이 과잉·분산되며 중요한 신호가 묻히는 문제를 해결하기 위해 NotiHub를 구축했습니다. 기존 웹훅 호환성을 유지하면서 이벤트 기반 라우팅과 팀 단위 운영 체계를 도입했습니다.

RAG 서비스의 신뢰성을 높이기 위해 RAGAS와 LLM-as-a-Judge 기반 자동 평가 체계를 소개했습니다. 또한 시맨틱 캐싱과 가드레일을 활용한 운영 최적화 방안도 함께 제시했습니다.

엠넷플러스는 투표 시스템을 이벤트 기반으로 재설계해 수집, 집계, 백업을 분리했습니다. 또한 DynamoDB와 SQS, MSK를 활용해 안정성과 처리 성능을 크게 개선했습니다.

SRE 반복 작업과 문의 대응을 Slack 워크플로 중심의 봇으로 자동화한 개발기입니다. 배포와 일반 요청 처리 시간을 크게 줄이고 운영 가시성도 높였습니다.

병원 예약을 진료 항목별 가변 슬롯 구조로 전면 개편한 사례를 다루었습니다. 동시성 제어와 추적 가능성을 위해 분산 락과 개별 레코드 기반 카운팅도 도입했습니다.

복지 포인트 서비스에서 보안, 대용량 처리, 일정 제약을 함께 해결한 개발 사례였습니다. 비동기 처리와 OGG 연동, GPT 기반 영수증 인식으로 현실적인 선택을 정리했습니다.