AI 서비스의 안정성과 비용 최적화 둘다 잡은 Runway Autoscaling 개발 여정 - 마키나락스 | Velopers

AI 서비스의 안정성과 비용 최적화 둘다 잡은 Runway Autoscaling 개발 여정

2025년 5월 27일

25

AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

Runway Autoscaling 개발 여정

이 게시물은 마키나락스의 AI 플랫폼 Runway에서 안정적인 서비스 운영과 비용 최적화를 위해 개발한 Autoscaling 기능에 대해 설명합니다.

Autoscaling의 필요성과 문제점

실시간 변동하는 서비스 요청량에 맞춰 컴퓨팅 자원을 동적으로 조절
초기 버전에서는 자원 한도 검증이 Autoscaling 과정에서 미흡하여 비용 문제와 자원 침해 위험 존재

기술적 배경과 해결 방안

KServe, Knative Serving, HPA 기반의 Autoscaling 구조 이해
사이드카 컨테이너, ResourceQuota, 커스텀 스케줄러 등 다양한 검증 방안 검토
최종적으로 Kubernetes Admission Control Webhook 방식을 선택하여 확장성과 유지보수성 확보

구현 및 효과

Webhook 서버를 통해 Deployment scale 변경 요청 시 Runway API로 자원 검증 수행
자원 한도 내에서만 Autoscaling 허용하여 비용 예측 가능성과 서비스 안정성 향상
멀티테넌트 환경에서 자원 거버넌스 강화 및 플랫폼 안정성 확보

연관 게시글

공공 폐쇄망 환경에 k8s 기반 AI 플랫폼 구현하기

공공 폐쇄망 환경에 k8s 기반 AI 플랫폼 구현하기

마키나락스

마키나락스 • 2025년 6월 10일

100만 TPS 로그 시스템, KEDA를 이용한 오토스케일링 적용기

100만 TPS 로그 시스템, KEDA를 이용한 오토스케일링 적용기

우아한 형제들

우아한 형제들 • 2025년 11월 27일

Kurly만의 MLOps 구축하기 - 초석 다지기

Kurly만의 MLOps 구축하기 - 초석 다지기

마켓컬리

마켓컬리 • 2022년 10월 26일