에이닷 RAG 기능 개발을 위한 Qdrant 벡터 DB 구축 (from source tarball)

에이닷 RAG 기능 개발을 위한 Qdrant 벡터 DB 구축 (from source tarball)

4
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

에이닷 RAG 기능 개발을 위한 Qdrant 벡터 DB 구축

이 게시물은 에이닷에서 맞춤형 모델의 실시간 동적 데이터 대응 및 할루시네이션 억제를 위해 RAG 기능 구현에 필수적인 Qdrant VectorDB를 On-premise 환경에서 소스 tarball을 이용해 구축한 과정을 설명합니다.

구축 배경 및 선택 이유

  • 파인튜닝 모델에 실시간 업데이트 대응과 외부 데이터 접근을 위해 RAG 기능 활용
  • Cloud, Kubernetes, Docker 방식 대신 독립 서버 호스팅을 위한 소스 컴파일 방식 채택
  • Qdrant Github Dockerfile 참고해 직접 바이너리 컴파일 및 서비스 운영

구축 과정 요약

  • Rust Toolchain 설치 및 필수 라이브러리 설정
  • Qdrant 소스 다운로드 후 싱글 스레드 컴파일
  • Web UI 경로 구성 및 클러스터 노드 3대 구성
  • config.yaml 수정과 노드별 '--uri' 및 '--bootstrap' 옵션으로 클러스터 활성화

운영 환경 및 주의사항

  • On-premise RHEL 8.10 환경, 메모리 6GB 이상 권장
  • 컴파일 및 클러스터 구성에 필요한 네트워크 설정 필요
  • Qdrant 공식 실행 스크립트 미제공으로 사용자 맞춤 서비스 스크립트 작성 필수