온디바이스 AI 얼굴 식별 파이프라인 최적화
39
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

이 게시물은 온디바이스 환경에서 얼굴 식별 파이프라인을 최적화한 방법과 결과를 공유한 글입니다.

핵심 요약

  • 목표: 기기 내에서 프라이버시를 지키며 갤러리 사진 중 사용자 얼굴을 빠르게 식별해 추천에 활용
  • 파이프라인 구조: 얼굴 탐지(Detection)와 얼굴 인식(Recognition)의 두 단계로 구성되어 latency와 throughput이 핵심 지표
  • 병목 식별: 이미지 로드·디코딩·모델 추론 단계에서 시간 집중됨
  • 주요 최적화 기법: decoding 이전 필터링(Predicate Pushdown), Top-K를 위한 Min-Heap 적용, TensorBuffer.floatArray 사용으로 JNI 호출 최소화
  • 병렬화 전략: TFLite 스레드 풀 크기 조정으로 latency 최적화, 모델 인스턴스 병렬화로 처리량 대폭 향상
  • 성과: 평균 처리시간 138ms → 87ms(약 37% 감소), 처리량 7.2 → 45.9 imgs/s(약 530% 개선)

연관 게시글