AI 서비스의 안정성과 비용 최적화 둘다 잡은 Runway Autoscaling 개발 여정
24
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

Runway Autoscaling 개발 여정

이 게시물은 마키나락스의 AI 플랫폼 Runway에서 안정적인 서비스 운영과 비용 최적화를 위해 개발한 Autoscaling 기능에 대해 설명합니다.

Autoscaling의 필요성과 문제점

  • 실시간 변동하는 서비스 요청량에 맞춰 컴퓨팅 자원을 동적으로 조절
  • 초기 버전에서는 자원 한도 검증이 Autoscaling 과정에서 미흡하여 비용 문제와 자원 침해 위험 존재

기술적 배경과 해결 방안

  • KServe, Knative Serving, HPA 기반의 Autoscaling 구조 이해
  • 사이드카 컨테이너, ResourceQuota, 커스텀 스케줄러 등 다양한 검증 방안 검토
  • 최종적으로 Kubernetes Admission Control Webhook 방식을 선택하여 확장성과 유지보수성 확보

구현 및 효과

  • Webhook 서버를 통해 Deployment scale 변경 요청 시 Runway API로 자원 검증 수행
  • 자원 한도 내에서만 Autoscaling 허용하여 비용 예측 가능성과 서비스 안정성 향상
  • 멀티테넌트 환경에서 자원 거버넌스 강화 및 플랫폼 안정성 확보

연관 게시글