0
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 하네스 엔지니어링 관점에서 Deep Insight의 로컬 개발에서 AWS 프로덕션까지의 설계 여정을 공유하는 글입니다.
핵심 설계 결정
- AgentCore Runtime에서 LLM 추론만 수행하고 코드 실행은 AWS Fargate로 분리하여 리소스·보안·스케일링 특성에 맞게 분리
- S3를 세션별 중간 저장소로 활용해 외부 메모리, 아카이브, Human-in-the-loop 피드백 루프 구현
- Private Subnet + VPC Endpoint + Security Group 조합으로 네트워크 완전 격리 및 최소 권한 원칙 적용
운영 관찰
- 실측 세션에서 LLM 추론 시간이 코드 실행 시간보다 월등히 길어 토큰 비용이 지배적
- 세션 격리, ALB sticky session, Health Check, 세밀한 세션 매니지먼트가 신뢰성 확보에 기여

