
AWS Node Auto Scaler Karpenter 도입기
Karpenter를 도입해 EKS 노드 확장 속도를 높이고 비용 최적화를 시도했습니다. 스파크성 트래픽과 Spot 운영 이슈를 보완하며 안정성과 효율을 함께 개선했습니다.
새로운 기술 블로그가 추가되었어요

Karpenter를 도입해 EKS 노드 확장 속도를 높이고 비용 최적화를 시도했습니다. 스파크성 트래픽과 Spot 운영 이슈를 보완하며 안정성과 효율을 함께 개선했습니다.


Terraform으로 EKS를 구성해 실시간 데이터 파이프라인과 CDC 파이프라인 구축을 다뤘습니다. 인프라를 선언적으로 관리하며 실시간 처리 환경을 준비하는 내용입니다.

SK플래닛의 클라우드 기반 검색 시스템 구조와 주요 기능을 소개했습니다. 또한 ChatGPT 이후 대화형 검색으로의 확장 가능성을 함께 살펴봤습니다.

DASH 2023 참가 후기를 통해 Datadog의 워크숍, 키노트, 한국어 세션, 부스 체험을 정리했습니다. Bits AI, Trace Queries, Flex Logs 같은 신규 기능과 현장 교류 경험도 공유했습니다.


회원 서비스의 병목 원인을 트랜잭션, DTO 변환, 스레드 설정에서 찾았습니다. 읽기 트랜잭션 축소, 수동 매핑, 톰캣 스레드 조정과 웜업으로 응답 편차를 크게 개선했습니다.

EKS 1.22 종료 대응을 위해 Route53 가중치 기반 Blue-Green 업그레이드를 적용했습니다. ArgoCD와 GitOps로 클러스터를 분리 관리하며 API 호환성과 롤백 제약을 줄였습니다.

AWS EKS에서 운영 중인 챗봇 서비스의 비용을 Spot by NetApp 도입으로 최적화한 사례입니다. 파드와 노드 교체 안정성을 보완해 수수료 포함 약 40% 절감했습니다.


매드업의 DMP 프리즘 구조와 운영 경험을 소개한 글입니다. V1의 한계를 바탕으로 V2에서 비동기화, 매니지드 서비스, RA3 전환을 통해 개선한 내용을 설명했습니다.


EKS의 CloudWatch 대시보드에서 네트워크 메트릭이 페타바이트로 보이는 문제를 분석했습니다. cAdvisor 누적값과 Pod 재시작 시 언더플로우가 원인이었습니다.


기존 데이터 파이프라인의 지연과 복잡성을 줄이기 위해 컬리가 BigQuery 도입 배경과 주안점을 정리했습니다. 스트리밍 적재, 파티션 관리, 프로젝트 분리로 성능과 비용을 함께 고려했습니다.


Eureka 서버의 Multi-Zone 구성에 맞춰 eurekube-operator 변경 내용을 공유했습니다. IDC와 EKS의 서비스 디스커버리 통합 맥락에서 Zone Failover 대응을 다뤘습니다.


AWS re:Invent 2022 라스베이거스 방문기를 정리한 글입니다. 행사 운영 방식과 Expo, 주요 세션 경험을 통해 AWS 생태계를 살펴보았습니다.