

RAGAS: RAG 시스템 성능 평가, 이제는 제대로 해보자!
RAGAS를 통해 RAG 시스템을 정량적으로 평가하는 방법을 소개했습니다. 주요 지표와 Streamlit 데모, LangSmith 연동까지 함께 설명했습니다.
#RAG#LLM
44005분


RAGAS를 통해 RAG 시스템을 정량적으로 평가하는 방법을 소개했습니다. 주요 지표와 Streamlit 데모, LangSmith 연동까지 함께 설명했습니다.
X

LLM 애플리케이션의 변동성과 복잡성을 줄이기 위해 테스트와 평가를 자동화하는 방법을 소개했습니다. Harness를 커스텀해 프롬프트, 지표, 아웃풋별 평가를 동적으로 처리하는 파이프라인을 구성했습니다.


AI가 채팅창을 넘어 로봇의 인지, 판단, 행동을 담당하는 흐름을 정리했습니다. 휴머노이드와 로봇 파운데이션 모델의 최신 사례도 함께 소개했습니다.

토스 프론트엔드 팀은 문서를 찾아가는 대신 질문하면 바로 답을 받는 환경을 만들었습니다. RAG 챗봇과 자동 문서화 봇으로 지식이 흐르는 팀 문화를 구축했습니다.

X

X

X

X


토크나이저가 LLM 성능과 비용에 미치는 영향을 설명하고, 언어별 차이와 한국어 최적화 사례를 소개했습니다. SKT의 Telco LLM이 한국어에서 더 효율적인 토크나이저를 설계한 배경과 비교 결과를 다뤘습니다.


안드로이드에서 Gemma2 파인튜닝 모델을 실행하는 과정을 파인튜닝, MediaPipe 변환, 온디바이스 실행 순서로 설명했습니다. 한국어 요약 모델 예시와 파인튜닝 전후 비교, 긴 입력 시 제약도 함께 다뤘습니다.


에이닷 3.1에 한국어 최적화 음성모드를 도입한 내용을 소개했습니다. 스트리밍 응답을 문장 단위로 나눠 TTS 지연을 줄인 구현 방식도 다뤘습니다.