‘로컬’ 슈퍼 앱에서 장기 유저 모델링은 어떻게 달라질까?

0
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 장기 유저 로그로 만든 공통 유저 임베딩과 그 적용 사례를 정리한 글입니다.

핵심 접근

  • 두-타워 구조: Causal Transformer로 유저 시퀀스 인코딩, MLP로 아이템 임베딩
  • Contrastive InfoNCE로 다음 액션 예측 방식으로 pretrain

아이템 표현과 인프라

  • ID 임베딩은 cold item 및 GPU 메모리 한계
  • LLM 기반 콘텐츠 임베딩으로 cold 대응 및 Transformer 대규모화 가능
  • memmap과 bbhash로 수억 개 임베딩의 파일 조회·매핑 문제 해결

지역 특화 학습

  • 지역 제약으로 in-batch의 98%가 impossible negatives 되어 학습 신호 희석
  • Region-Constrained Batch Sampling(RCBS)으로 impossible negatives 비율 98%→30% 감소, harder negative 확보

적용과 결과

  • 유저 임베딩을 랭킹·후보·광고에 피처로 적용해 온라인 지표 전반 개선
  • 임베딩 갱신은 24시간 주기 및 beam pipeline 기반 부분 갱신으로 비용 최적화

연관 게시글