
5
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 메신저용 온디바이스 이미지 검색을 지식 증류로 다국어 확장한 경험을 정리한 글입니다
핵심 아이디어
- 영어로 학습된 텍스트 인코더를 교사로 고정하고 학생 모델을 다국어 입력으로 학습해 임베딩 정렬
- MSE 손실로 교사 임베딩을 추종하도록 학습
성과
- 영어 성능 소폭 하락 대비 일본어·중국어·태국어·한국어 포함 5개 언어 Recall@5 평균 약 78% 달성
온디바이스 구현 포인트
- PyTorch→LiteRT 변환 시 연산 호환 및 양자화 전략 선택과 LiteRT 버전 정합 중요
- 전처리·토크나이저 정합과 HNSW 기반 벡터 DB 튜닝으로 수만 장 규모에서 평균 응답 약 110ms 확보

