
39
AI 요약
이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.
이 게시물은 온디바이스 환경에서 얼굴 식별 파이프라인을 최적화한 방법과 결과를 공유한 글입니다.
핵심 요약
- 목표: 기기 내에서 프라이버시를 지키며 갤러리 사진 중 사용자 얼굴을 빠르게 식별해 추천에 활용
- 파이프라인 구조: 얼굴 탐지(Detection)와 얼굴 인식(Recognition)의 두 단계로 구성되어 latency와 throughput이 핵심 지표
- 병목 식별: 이미지 로드·디코딩·모델 추론 단계에서 시간 집중됨
- 주요 최적화 기법: decoding 이전 필터링(Predicate Pushdown), Top-K를 위한 Min-Heap 적용, TensorBuffer.floatArray 사용으로 JNI 호출 최소화
- 병렬화 전략: TFLite 스레드 풀 크기 조정으로 latency 최적화, 모델 인스턴스 병렬화로 처리량 대폭 향상
- 성과: 평균 처리시간 138ms → 87ms(약 37% 감소), 처리량 7.2 → 45.9 imgs/s(약 530% 개선)


![[Jetpack Compose — Part 3] Jetpack Compose, 데이터로 성능과 안정성을 증명하다](https://miro.medium.com/v2/resize:fit:1200/1*fzHVp60NQLB9-H8fQYCmrA.png)