낯선 오타와 싸워서 이기고 싶은 마음

AI

낯선 오타와 싸워서 이기고 싶은 마음

SSG.COM

SSG.COM2026년 4월 23일

두줄요약

검색 오타 보정의 기존 로그 기반 방식 한계를 줄이기 위해 번역 모델과 멀티태스크 학습을 도입했습니다. 검색 실패율을 낮추고 CTR을 유지하는 성과와 함께 후속 개선 과제도 정리했습니다.

문제 상황

검색 오타 보정의 기존 방식이 로그 기반 사후 집계에 의존해 커버리지가 낮은 한계
새로운 오타 패턴은 초기 검색 실패를 피하기 어려운 구조
오타-정타 쌍 수집 자체도 희소성과 수작업 비용이 큰 문제

해결 방법

검색어 임베딩 다중 질의, 벡터검색, 번역 모델 중 운영 부담이 상대적으로 낮은 번역 모델 채택
정타를 선별한 뒤 오타를 생성하는 방식으로 학습 데이터 구성
multitask learning과 편집거리 필터링으로 문맥 부족과 허위 보정 문제 완화

성능/운영 포인트

검색 실패율과 실패검색어의 벡터검색 의존 비중 감소
보정 결과의 CTR 유지와 월 단위 매출 기여
추가 GPU·벡터검색 도입, 생성형 검색 모델 등 후속 개선 과제 존재

댓글 0개

댓글을 작성하려면 로그인이 필요합니다.

댓글을 불러오는 중...