100만 TPS 로그 시스템, KEDA를 이용한 오토스케일링 적용기

2025년 11월 27일

16

AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 KEDA를 이용한 Grafana Loki 로그 시스템의 오토스케일링 적용기

문제 정의

일별 수십TB·피크 초당 100만 건 이상 로그 유입과 큰 트래픽 변동성
기본 HPA의 평균 기반 스케일링으로 인한 불안정성과 오버스케일링 문제

구성 및 병목

Fluentd → Loki(Distributor → Ingester → S3) 구조에서 Ingester와 Fluentd 버퍼·메모리 의존으로 병목 발생

KEDA 도입 및 설정 포인트

Prometheus 등 외부 이벤트 기반 트리거로 HPA의 평균의 함정 보완
metricType 선택과 horizontalPodAutoscalerConfig로 과도한 스케일링 제어 및 stabilization 적용

연관 게시글

AI 서비스의 안정성과 비용 최적화 둘다 잡은 Runway Autoscaling 개발 여정

AI 서비스의 안정성과 비용 최적화 둘다 잡은 Runway Autoscaling 개발 여정

마키나락스

마키나락스 • 2025년 5월 27일

AWS 서비스를 활용한 Kubernetes 클러스터 구축

AWS 서비스를 활용한 Kubernetes 클러스터 구축

VCNC

VCNC • 2019년 3월 19일

Vector를 활용해 멀티 CDN 로그 및 트래픽 관리하기

Vector를 활용해 멀티 CDN 로그 및 트래픽 관리하기

라인 • 2023년 10월 13일