전 세계 18억 명이 사용하는 삼성 계정 서비스, 리전 규모 장애가 발생한다면?
62
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

삼성 계정 서비스의 글로벌 리전 규모 장애 대응 아키텍처

이 게시물은 전 세계 18억 명이 사용하는 삼성 계정 서비스가 리전 단위 장애를 극복하기 위해 AWS 다중 리전과 Route 53 기반의 Active-Active DR 아키텍처를 구축한 사례를 설명합니다.

주요 아키텍처 개선 사항

  • EU, US, AP 3개 리전에 마이크로서비스 완전 일치화 및 데이터 동기화 구축
  • Route 53 Application Recovery Controller(ARC)를 활용해 리전 장애 시 DNS 기반 트래픽 신속 전환 구현
  • CloudFront CDN 도입으로 클라이언트 DNS 캐시 문제 및 네트워크 연결 지연 개선

운영환경 모의 장애 훈련 결과 및 개선

  • 1차 훈련에서 5분 내 90% 트래픽 전환 성공, DNS 캐시 문제로 99% 복구 목표 미달성
  • CloudFront 적용 후 2차 훈련에서 3분 내 99% 이상 트래픽 전환 및 네트워크 연결 속도 65% 향상

결론

수차례 아키텍처 개선과 장애 훈련을 통해 신뢰성 높은 글로벌 삼성 계정 서비스 장애 대응 체계를 마련했습니다.

연관 게시글