

효율적인 CLAUDE.md 파일관리 및 컨텍스트 최적화 전략
Claude Code의 CLAUDE.md를 토큰 효율 중심으로 관리하는 방법을 정리했습니다. 컨텍스트 부패를 줄이기 위해 핵심 규칙만 남기고 Hook과 Skills로 분리하는 전략을 제안했습니다.


Claude Code의 CLAUDE.md를 토큰 효율 중심으로 관리하는 방법을 정리했습니다. 컨텍스트 부패를 줄이기 위해 핵심 규칙만 남기고 Hook과 Skills로 분리하는 전략을 제안했습니다.

Slack 봇 창식이를 통해 하네스 엔지니어링과 컨텍스트/피드백 루프 설계를 실제 운영에 적용한 사례를 정리했습니다. MCP 채널, 지식 베이스, 교정 로그로 장기 작업의 정확도를 높인 구성이 핵심입니다.

Multi-AZ 기반 Active-Active 설계로 장애 시에도 서비스 연속성을 높이는 클라우드 아키텍처를 다뤘습니다. Multi-Region과 DR의 차이, RTO·RPO 한계, 보안·데이터 안정성 전략도 함께 정리했습니다.


LLM은 정답을 맞히는 능력만큼, 모를 때 멈추는 능력도 중요하다고 정리했습니다. 모델 크기나 추론 강화만으로는 부족해, 별도의 평가와 정렬 설계가 필요했습니다.


vLLM Tensor Parallelism으로 G5/G6의 24GB GPU 여러 장에 LLM을 분산 서빙하는 방법을 설명했습니다. 벤치마크에서 TP=4는 응답 속도와 처리량을 크게 개선했으며, 비용 효율적인 대안으로 제시했습니다.
중고 의류 디테일컷 자동 생성을 위해 VLM 대신 Detector와 규칙 기반 크롭을 선택했습니다.\n그 결과 공정 시간을 90% 줄이고 11만 개 상품에 일괄 적용했습니다.
X

AI 에이전트의 토큰 소비와 정확도 문제를 줄이기 위한 컨텍스트 엔지니어링을 ADK 사례로 설명했습니다. 도구 필터링과 에이전트 분리, 입출력 구조화로 토큰을 40% 절감한 실험 결과도 공유했습니다.

브라우저 안에서 동작하는 차트 추천 봇을 만들고, 서버 없이 추론하는 구조를 선택했습니다. 규칙 엔진으로 차트 유형을 정하고 SLM은 설명만 맡겨 안정성을 높였습니다.


현대오토에버가 GenAI Sandbox와 해커톤으로 전사 GenAI 실험 환경을 구축했습니다. 14개 팀이 참여해 업무 자동화와 생산성 향상 사례를 만들었습니다.

X


Amazon OpenSearch Service로 다국어 이력서 검색 파이프라인과 인덱싱 구조를 재설계했습니다. 전처리, 정규화, 임베딩 입력 전략이 검색 정확도를 크게 좌우했습니다.