
쿠버네티스 커스텀 리소스 정의하고 관리하기(feat.컨트롤러)
쿠버네티스 컨트롤러로 커스텀 리소스를 선언적으로 관리하는 방법을 설명했습니다. Informer와 WorkQueue를 포함한 내부 동작과 운영 사례도 함께 소개했습니다.
새로운 기술 블로그가 추가되었어요

쿠버네티스 컨트롤러로 커스텀 리소스를 선언적으로 관리하는 방법을 설명했습니다. Informer와 WorkQueue를 포함한 내부 동작과 운영 사례도 함께 소개했습니다.

WATCHA는 멀티 클라우드 데이터 마이그레이션을 Argo Workflows로 통합해 운영 복잡성을 줄였습니다. 또한 DynamoDB Incremental Export와 권한 페더레이션으로 비용과 보안을 함께 개선했습니다.

쿠버네티스에서 팟이 떠오를 때 내부 동작이 어떻게 흘러가는지 살펴보는 글입니다.\n쓰기만 하던 개발자가 궁금해할 만한 쿠버네티스 기초 이해를 돕습니다.

쿠버네티스 클러스터에서 경량 PostgreSQL을 운영하는 사례를 소개합니다. 기존 VM 기반 RDB 운영과 다른 배포·운영 맥락을 다룹니다.

쿠버네티스에서 파드를 분산 배치하는 세 가지 방법과 토폴로지 분배 제약 조건의 핵심 옵션을 설명했습니다.\n팀 적용 사례를 통해 고가용성과 운영 안정성을 높이는 설정 방식도 소개했습니다.


Seldon Core를 이용한 모델 서빙 관리와 배포 흐름을 소개했습니다. Kubernetes 환경에서 모니터링과 A/B 테스트까지 함께 고려할 수 있었습니다.

쿠버네티스 중계 API 서버를 Python에서 Go로 재구현하고 Informer 캐시를 적용했습니다. 그 결과 800개 노드의 리소스 계산 시간이 약 10초에서 0.2초로 줄었습니다.


로봇 엣지 디바이스에서 동작하는 MLOps 파이프라인과 TensorRT 기반 추론 도구를 소개했습니다. Trtexec, TREx, Nsight Systems로 변환·시각화·성능 분석을 수행하는 흐름을 정리했습니다.
토스증권이 투자 분석용 LLM을 위해 자체 고성능 GPU 클러스터를 도입한 배경을 설명했습니다. 개인정보 보호, 비용 효율, 실시간성 제약과 GPU 운용상의 유의점을 함께 짚었습니다.


로봇용 머신러닝 개발에서 재현성과 온프레미스 자원 관리가 왜 중요한지 설명했습니다. K3s와 Airflow로 이를 해결하는 MLOps 구성 방법을 소개했습니다.


관리형 서비스의 Airflow를 Kubernetes로 전환하며 스케줄러 CPU 과부하, 워커 OOM, 로그 누락 문제를 해결한 운영 경험을 공유했습니다. 자원 제한과 노드 분리를 통해 안정성을 높이고 비용도 줄인 사례입니다.
Java와 Spring Boot로 쿠버네티스 오퍼레이터를 구현하는 과정을 정리했습니다. CRD, Reconciler, Dependent Resource 구성과 로컬 클러스터 테스트, 배포 방법까지 살펴봤습니다.