
케클s피드 1월호|AI는 이미 도입됐습니다. 관건은 운영입니다.
AI 도입 이후의 핵심 과제로 안정적 운영과 확장성을 짚었습니다. 국산 NPU 실증, GitOps 자동화, 데이터센터 전환 흐름을 함께 정리했습니다.

AI 도입 이후의 핵심 과제로 안정적 운영과 확장성을 짚었습니다. 국산 NPU 실증, GitOps 자동화, 데이터센터 전환 흐름을 함께 정리했습니다.


EKS에서 Slinky로 Slurm을 배포하는 방법과 구성 요소를 소개했습니다. Kubernetes와 Slurm을 함께 써서 AI·HPC 워크로드를 효율적으로 운영하는 방안을 정리했습니다.

스마트스토어센터가 Oracle에서 MySQL로 무중단 전환한 방법을 이중 쓰기 중심으로 설명했습니다. JPA와 MyBatis에서의 트랜잭션 처리, PK와 컬럼 타입 조정까지 다뤘습니다.

레거시 인프라를 정리하고 OpenStack 기반 프라이빗 클라우드를 새로 구축했습니다. AWS와 Active-Active 하이브리드로 운영하며 자동화와 고가용성을 확보했습니다.


Node.js 컨테이너가 종료 시그널을 받아도 바로 안 죽는 원인을 PID 1과 이벤트 루프로 분석했습니다. dumb-init과 shutdown 훅, K8s 종료 설정을 함께 조정해 graceful shutdown을 맞췄습니다.


Amazon EKS 전환 이후 누적된 운영 toil을 줄이기 위해 Kiro로 Spec-driven IDP를 구축한 사례를 소개했습니다. 문서화된 요구사항과 체크리스트 기반 자동화로 개발자 셀프서비스와 운영 효율을 높였습니다.


온프레미스 GPU와 AWS EKS를 Hybrid Nodes로 통합해 운영했습니다. 비용은 약 70% 절감하고, 장애 시 페일백까지 확보했습니다.


Argo CD Image Updater로 이미지 태그 갱신과 배포 연결을 자동화하는 방법을 정리했습니다. Jenkins 중심 파이프라인을 GitOps 기반으로 경량화한 구성도 함께 설명했습니다.

2025 AWS re:Invent 현장에서 확인한 AI·운영·보안의 기술 흐름을 정리했습니다. EKS 운영과 DevSecOps 자동화 사례를 중심으로 실무 인사이트를 공유했습니다.


KubeVirt GPU VM에 PCoIP Graphics Agent를 연동해 원격 그래픽 가속 환경을 구성했습니다. 또한 Air-Gap 환경용 오프라인 라이선스 서버와 GPU 최적화 설정을 적용했습니다.

수천 개의 API/BATCH 서버 설정을 하나의 체계로 관리하는 방법을 소개했습니다. 오버레이, 템플릿, 선언형 설정과 동적 프로비저닝으로 설정을 진화시킨 사례를 다뤘습니다.


KubeVirt GPU VM에 PCoIP Graphics Agent를 연동해 원격 그래픽 환경을 구축했습니다. 또한 Air-Gap 환경용 오프라인 라이선스 서버를 설치해 내부망에서도 정상 인증되도록 설정했습니다.