삼성계정 서비스, 대규모 트래픽 속 무 중단 클라우드 인프라 업그레이드의 비결
33
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

삼성계정 서비스의 무중단 클라우드 인프라 업그레이드

이 게시물은 삼성계정 서비스가 대규모 트래픽 속에서도 무중단으로 클라우드 인프라를 업그레이드한 사례를 소개합니다.

서비스 개요 및 아키텍처

  • 17억 이상 사용자를 지원하며 60여 개 서비스를 연동하는 글로벌 계정 서비스
  • AWS 기반 4개 리전에서 MSA와 Kubernetes(EKS)로 운영
  • AuroraDB, DynamoDB, MSK 등 다양한 AWS Managed Service 활용

업그레이드 도전과 해결책

  • 지원 종료 주기에 따른 Managed Service 업그레이드 부담
  • 무중단 운영을 위한 Multi Cluster 아키텍처 설계
  • 트래픽 전환은 DNS 기반 Weighted Record 방식 적용
  • 롤백 플랜과 트래픽 전환 비율 조절로 안정적 업그레이드 달성

결과 및 교훈

  • 3개 리전, 6개 EKS 클러스터, 210여 개 마이크로서비스 무중단 업그레이드 성공
  • 내부 IP 부족 이슈 발생 후 신속한 노드 스케일업 대응
  • DNS 트래픽 전환 시 5분 내 99.9% 전환 확인

연관 게시글