2
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 RAG의 임베딩 원리와 벡터 인덱싱 최적화 기술을 정리한 글입니다.
임베딩 핵심: 텍스트를 고차원 벡터로 매핑, 매니폴드 가설에 따른 유사도 탐색
모델 유형과 선정 전략
- Dense·Sparse·Multimodal 임베딩 비교 및 하이브리드 검색 권장
- 다국어 환경에서는 사전학습 데이터 비중 기반의 자체 벤치마크로 교차 검증 필요
인덱싱과 최적화 기법
- HNSW의 다층 그래프 탐색 원리와 대규모 메모리 한계
- DiskANN의 SSD 기반 2단계 탐색, GPU 가속(CAGRA/cuVS), 양자화(SQ·PQ·BQ)를 통한 메모리·속도 최적화

