비동기 요청-응답 패턴으로 풀어낸 발주 서비스 개발기
올리브영은 기존 동기식 발주 시스템의 한계를 극복하고 Kafka 기반 비동기 요청-응답 아키텍처로 발주 서비스를 개선했습니다. 이를 통해 발주 처리 속도를 크게 향상시키고 서비스 안정성과 확장성을 확보했습니다.

올리브영은 기존 동기식 발주 시스템의 한계를 극복하고 Kafka 기반 비동기 요청-응답 아키텍처로 발주 서비스를 개선했습니다. 이를 통해 발주 처리 속도를 크게 향상시키고 서비스 안정성과 확장성을 확보했습니다.
올리브영은 전국 3,500대 POS 장비에 Datadog을 도입해 장애 탐지 시간을 76% 단축하고 선제적 대응 체계를 구축했습니다. 이로써 실시간 모니터링과 부서 간 협업을 강화하여 안정적인 리테일 운영 환경을 만들었습니다.
이 글은 AWS Summit Seoul 2025에서 발표한 올리브영의 클라우드 스케일링 자동화 전략을 소개합니다. Auto Scaling의 한계를 극복하기 위해 트래픽 카테고리화와 비즈니스 중심 모니터링을 결합한 4단계 접근법을 제안합니다.
iOS 개발자가 CJ올리브영 QA 엔지니어로 전환하여 5개월간 온보딩과 실무를 거치며 품질 설계와 협업의 중요성을 배웠습니다. 그는 QA가 단순 검사자가 아닌 서비스 품질을 책임지는 역할임을 깨닫고 성장 의지를 다졌습니다.
iOS 개발자는 올리브영 QA팀에 합류해 5개월간 온보딩을 통해 QA 엔지니어로 성장하는 과정을 공유합니다. 개발자 경험을 바탕으로 기획부터 품질 설계와 협업 문화를 익히며 실무에 적응해 나갔습니다.
이 게시물은 올리브영이 카오스 엔지니어링을 도입해 API의 null exception 문제를 사전 탐지하고 서비스 안정성을 강화한 사례를 소개합니다. mitmproxy를 이용한 자동화 테스트로 QA 업무와 장애 대응 역량을 높이는 방법을 설명합니다.
올리브영은 사용자 행동 데이터를 활용해 의미론적 유사도를 반영하는 상품 추천 언어 모델을 개발했습니다. 이 모델은 기존 속성 기반 추천의 한계를 극복하고 CTR 50% 개선 등 실질적 성과를 보였습니다.
1인 QA 체제로 제한된 리소스 안에서 사용자 관점의 서비스 이해와 우선순위 기반 테스트 체계를 구축했습니다. 명확한 테스트 시작, 종료, sign-off 조건을 통해 팀 내 품질 기준 합의를 이뤘습니다.
올리브영의 셔터 서비스는 M3U8(HLS) 포맷 도입과 하이브리드 업로드 방식을 통해 숏폼 스트리밍을 최적화했습니다. iOS와 Android의 플랫폼별 호환성 이슈를 해결하며 사용자 경험과 서비스 성과를 동시에 개선했습니다.
올리브영은 기존 외부 플랫폼의 지연 문제를 해결하기 위해 Google Play와 Apple App Store API 기반의 앱 리뷰 수신 시스템을 개발했습니다. 이 시스템은 리뷰 수신 리드타임을 50% 단축하고 Slack 알림, AWS 기반 CI/CD 등으로 운영 효율을 크게 향상시켰습니다.