0
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 RAG에서 검색 고도화와 리랭킹을 통해 정확도와 근거 문서 품질을 높이는 실무형 파이프라인을 설명합니다.
검색 실패를 회수 실패(Retrieval Failure)와 정렬 실패(Ranking Failure)로 구분하고, 각각 질문 다듬기/다중 검색과 리랭킹으로 대응하는 접근을 제시합니다.
스파스(BM25)와 덴스(Dense) 검색의 장단점을 비교하고, 질문 유형에 따라 하이브리드 검색 비중을 조절하는 전략을 다룹니다.
하이브리드 검색은 병렬 검색→후보 결합→순위 융합으로 구성되며, 엔터프라이즈에서는 Permission-aware Retrieval을 위해 Pre-filter 방식이 필요함을 강조합니다.
질의 라우팅(Query Routing)과 질의 변환(Query Rewriting/Expansion, Multi-query, Query Decomposition)을 통해 질문 복잡도에 따라 동적 경로를 선택하고 비용을 통제하는 Adaptive Retrieval을 소개합니다.
리랭킹 단계의 진화로 Cross-encoder, LLM 리랭커, Ranking-free selection을 비교하고 정확도·지연·비용 제약에 따라 선택하는 기준을 제시합니다.
