하네스 엔지니어링으로 본 Deep Insight – 로컬 개발에서 프로덕션 운영까지의 설계 여정
0
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 하네스 엔지니어링 관점에서 Deep Insight의 로컬 개발에서 AWS 프로덕션까지의 설계 여정을 공유하는 글입니다.

핵심 설계 결정

  • AgentCore Runtime에서 LLM 추론만 수행하고 코드 실행은 AWS Fargate로 분리하여 리소스·보안·스케일링 특성에 맞게 분리
  • S3를 세션별 중간 저장소로 활용해 외부 메모리, 아카이브, Human-in-the-loop 피드백 루프 구현
  • Private Subnet + VPC Endpoint + Security Group 조합으로 네트워크 완전 격리 및 최소 권한 원칙 적용

운영 관찰

  • 실측 세션에서 LLM 추론 시간이 코드 실행 시간보다 월등히 길어 토큰 비용이 지배적
  • 세션 격리, ALB sticky session, Health Check, 세밀한 세션 매니지먼트가 신뢰성 확보에 기여

연관 게시글