우리는 달에 가기로 했습니다. - Hybrid인프라부터 네트워크 최적화까지, 무신사 AI Infra구축기
AI 인프라를 하이브리드 구조로 재설계해 비용과 운영 리스크를 줄인 사례를 다뤘습니다. Cilium, NLB, OpenTelemetry, Gateway API로 지연과 확장성을 함께 최적화했습니다.
새로운 기술 블로그가 추가되었어요
AI 인프라를 하이브리드 구조로 재설계해 비용과 운영 리스크를 줄인 사례를 다뤘습니다. Cilium, NLB, OpenTelemetry, Gateway API로 지연과 확장성을 함께 최적화했습니다.

EKS에서 EBS 볼륨의 AZ 종속성 때문에 파드 어태치 실패가 발생하는 사례를 정리했습니다. 멀티 AZ가 필요하면 Affinity로 고정하거나 EFS로 전환하는 방식이 핵심입니다.

Amazon Linux 1 지원 종료로 EKS 노드그룹 전환이 필요해졌습니다. 운영 구조를 유지하려면 새 노드그룹 교체가 기본 전략이 되고, 필요 시 신규 클러스터도 고려해야 했습니다.


S3 Tables의 운영 전략과 StarRocks 도입 과정을 정리했습니다. Compaction, Snapshot, 모니터링, 캐시 TTL 설정의 실무 포인트를 다뤘습니다.

요기요의 카오스 엔지니어링 도입 과정과 실험 설계 방법을 공유했습니다. Istio와 권한 설정 이슈를 해결하며 AWS FIS로 네트워크 지연 주입을 성공시켰습니다.


당근은 AWS 기반 피처 플랫폼의 수집 계층을 스트림과 배치로 나누어 구성했습니다. 대규모 이벤트와 배치 작업을 안정적으로 처리하며 운영상의 개선점도 함께 정리했습니다.


AWS PrivateLink의 NLB→ALB(Ingress) 구성에서 Health Check 실패 원인과 해결 방법을 정리했습니다. NLB ENI IP를 기준으로 Ingress 정책을 추가해 안전하게 문제를 해결했습니다.

Vueron은 VueX를 설치형에서 SaaS로 전환하며 AWS SBT와 CDK를 활용해 멀티테넌트 구조를 빠르게 구축했습니다. 그 결과 온보딩 자동화, 운영 표준화, 비용 절감과 성능 개선을 동시에 확보했습니다.

마이리얼트립의 Product Engineer 직무 확장 프로그램 1기 부트캠프 과정을 소개했습니다. 프론트엔드, 백엔드, 안드로이드 실습을 통해 문제를 끝까지 책임지는 개발 문화를 체험했습니다.


GitLab CI와 ArgoCD Notifications로 배포 알림을 통합하고 세분화했습니다.\n팀별 대응과 관제 가시성을 함께 높이도록 Slack 알림 구조를 개선했습니다.


GitLab CI와 ArgoCD Notifications로 CI/CD 알림을 통합하고 세분화했습니다.\n환경별 채널 분리와 노이즈 제거로 배포 가시성을 높였습니다.


Helm Chart를 서비스별로 흩어 관리하던 구조를 AWS ECR 기반 Registry로 중앙화했습니다. 버전 관리와 롤백 체계를 정비해 배포 일관성과 운영 효율을 높였습니다.