
71
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
LLM 품질 평가 및 확장 사례: SPeCTRA와 채팅플러스 검증 도입
이 게시물은 에이닷 QE팀이 LLM 품질 평가 도구인 SPeCTRA를 채팅플러스 PC버전 신규 서비스 검증에 도입한 경험을 소개합니다.주요 내용
- SPeCTRA를 활용해 LLM 응답 품질을 평가하는 기준과 자동화 테스트 방식을 설명
- Postman과 Judge 모델을 활용한 API 호출 기반 자동화 테스트 설계 및 실행 방법
- 서비스 특성에 맞춘 평가 항목과 Judge prompt 튜닝 사례
- Update 기능 테스트 자동화로 테스트 커버리지 확대 및 효율성 향상
적용 효과
- 테스트 효율성 및 커버리지 확대, 인력과 시간 리소스 절감
- 서비스별 맞춤형 평가 기준 적용으로 품질 검증의 정확도 향상

![[에이닷 4.0 QE 여정3] LLM 품질 평가의 진화: SPeCTRA 2.0 톺아보기](https://devocean.sk.com/thumnail/2025/9/2/18a05ae6f560f5663e7ef7428eb491c7362f850ffff2113554dc7f15d3f4db6f.png)
![[에이닷 4.0 QE 여정1] 에이닷 4.0 품질 비하인드](https://devocean.sk.com/thumnail/2025/9/2/c3158e6429d9e81ba35fff3f4ca44d69c18c332adb863e8c5ebe24928abc89bb.png)