
33
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
삼성계정 서비스의 무중단 클라우드 인프라 업그레이드
이 게시물은 삼성계정 서비스가 대규모 트래픽 속에서도 무중단으로 클라우드 인프라를 업그레이드한 사례를 소개합니다.서비스 개요 및 아키텍처
- 17억 이상 사용자를 지원하며 60여 개 서비스를 연동하는 글로벌 계정 서비스
- AWS 기반 4개 리전에서 MSA와 Kubernetes(EKS)로 운영
- AuroraDB, DynamoDB, MSK 등 다양한 AWS Managed Service 활용
업그레이드 도전과 해결책
- 지원 종료 주기에 따른 Managed Service 업그레이드 부담
- 무중단 운영을 위한 Multi Cluster 아키텍처 설계
- 트래픽 전환은 DNS 기반 Weighted Record 방식 적용
- 롤백 플랜과 트래픽 전환 비율 조절로 안정적 업그레이드 달성
결과 및 교훈
- 3개 리전, 6개 EKS 클러스터, 210여 개 마이크로서비스 무중단 업그레이드 성공
- 내부 IP 부족 이슈 발생 후 신속한 노드 스케일업 대응
- DNS 트래픽 전환 시 5분 내 99.9% 전환 확인