99
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 Tesla T4 16GB 한 장 환경에서 Gemma 3-4B 기반 sLLM을 QLoRA로 SFT해 리뷰 테마 추천 시스템을 구축한 경험을 공유하는 글입니다.
핵심 요약
- Gemma 3-4B-IT 기반 도메인 특화 SFT로 리뷰 테마 표현 생성
- Tesla T4 16GB 환경에서 QLoRA, LoRA, 4bit 양자화, gradient checkpointing 적용 학습
- 프롬프트 단축(528자→98자)으로 토큰·응답시간·비용 절감
- 상용 LLM 대비 약 95% 정확도, 배치 기준 응답 약 0.6초
- Human-in-the-loop 검수 및 임베딩 클러스터링으로 품질 관리
- 이미지 자동 생성 파이프라인 및 대형 모델 확장 등 향후 고도화 계획

