Amazon SageMaker HyperPod의 오토스케일링 알아보기
SageMaker HyperPod에서 관리형 Karpenter로 GPU 노드 오토스케일링을 지원하게 되었습니다. KEDA 연동으로 파드와 노드를 함께 자동조정해 비용과 성능을 최적화할 수 있습니다.

SageMaker HyperPod에서 관리형 Karpenter로 GPU 노드 오토스케일링을 지원하게 되었습니다. KEDA 연동으로 파드와 노드를 함께 자동조정해 비용과 성능을 최적화할 수 있습니다.
사내 코드와 문서를 연동한 RAG 기반 챗봇을 AWS Bedrock·OpenSearch·Titan·Claude로 구축했습니다. CI/CD 연동으로 코드 변경 시 KB를 5분 내에 동기화하여 최신 스펙 조회를 지원합니다.
LY는 자체 시계열 데이터베이스를 도입해 대규모 지표 처리와 조회 성능을 개선했습니다. S3 하이브리드 저장과 AI 연동으로 중앙화된 관찰가능성 플랫폼을 구축합니다.
이 글은 장애 대응에서 First Action의 중요성과 우아한형제들의 장애 관리 라이프사이클을 소개했습니다. 라이프사이클과 시간 기반 메트릭으로 병목을 식별하고 자동화·프로세스 중심의 운영 개선을 지향합니다
이 글에서는 GIGACHAD 페르소나 채팅봇을 FastAPI 기반 SSR로 개발한 과정을 설명했습니다. gemini-flash-2-0 모델 선택 이유와 사용자 프라이버시 및 브라우저 저장소로 컨텍스트 관리하는 방안을 안내합니다.
단계적 오픈과 실데이터 리허설로 정산 시스템을 안정적으로 운영했습니다. 일·월 정산 성공률 100%와 처리 시간 단축을 달성하여 수기 개입 없이 마감했습니다.
마이리얼트립은 계약 검토 전 사실관계를 구조화하는 AI 시스템을 도입했습니다. 이를 통해 불필요한 핑퐁을 줄이고 법무의 판단 집중도를 높였습니다.
엔터프라이즈 환경에서 멀티 에이전트 운영과 인증·권한 관리를 AgentCore로 중앙화했습니다. AgentCore Gateway·Identity·Runtime을 통해 접근 제어와 관측성, 배포를 간소화합니다
레거시 세션 인증을 OAuth2로 무중단 전환했습니다. Feature Flag, Jitter, Circuit Breaker로 대규모 트래픽에서도 무장애 운영했습니다.
COMMIT 오프라인 세션에서 시니어 개발자의 문제 인식과 의사결정 과정을 다루었습니다. 비즈니스 임팩트 우선, 문제 정의의 힘, 팀 기준 수립의 필요성을 공유했습니다.