
62
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
삼성 계정 서비스의 글로벌 리전 규모 장애 대응 아키텍처
이 게시물은 전 세계 18억 명이 사용하는 삼성 계정 서비스가 리전 단위 장애를 극복하기 위해 AWS 다중 리전과 Route 53 기반의 Active-Active DR 아키텍처를 구축한 사례를 설명합니다.주요 아키텍처 개선 사항
- EU, US, AP 3개 리전에 마이크로서비스 완전 일치화 및 데이터 동기화 구축
- Route 53 Application Recovery Controller(ARC)를 활용해 리전 장애 시 DNS 기반 트래픽 신속 전환 구현
- CloudFront CDN 도입으로 클라이언트 DNS 캐시 문제 및 네트워크 연결 지연 개선
운영환경 모의 장애 훈련 결과 및 개선
- 1차 훈련에서 5분 내 90% 트래픽 전환 성공, DNS 캐시 문제로 99% 복구 목표 미달성
- CloudFront 적용 후 2차 훈련에서 3분 내 99% 이상 트래픽 전환 및 네트워크 연결 속도 65% 향상