
메신저용 온디바이스 이미지 모델 학습기 2편: 초저지연 비자기회귀(non-autoregressive) 캡션 생성 전략
모바일 메신저용 이미지 캡션 생성을 위해 비자기회귀 디코딩과 지식 증류를 적용했습니다. 캡션 재생성과 다단계 정제로 200~400ms 지연과 실사용 가능한 품질을 달성했습니다.
새로운 기술 블로그가 추가되었어요

모바일 메신저용 이미지 캡션 생성을 위해 비자기회귀 디코딩과 지식 증류를 적용했습니다. 캡션 재생성과 다단계 정제로 200~400ms 지연과 실사용 가능한 품질을 달성했습니다.

네트워크 없이 모바일 기기에서 동작하는 메신저용 이미지 이해 기능을 만들고 지식 증류로 다국어 검색을 구현했습니다. 또한 LiteRT 변환과 벡터 DB 튜닝으로 온디바이스 배포와 실사용 성능을 맞췄습니다.

외국인 사용자가 토스 인증과 가입 과정에서 왜 이탈하는지 유저 리서치로 살펴봤습니다. 이름·주소 입력과 본인인증 허들이 오프라인 의존으로 이어지는 맥락을 확인했습니다.

멀티 센터 전환에 맞춰 배송최적화 시스템을 도입하고 주문분배·이관을 자동화했습니다. 그 결과 배송 리드타임을 평균 14시간 단축하고 운영 개입을 크게 줄였습니다.


AI가 대신 쇼핑하는 미래를 위해 UCP, AP2, x402와 USDC 기반 결제 구조를 설명했습니다. 또한 통제 가능한 자동화가 AI 커머스의 핵심이라는 점을 정리했습니다.


Astronomer Agents는 Airflow API와 로그를 활용해 Dag 개발, 테스트, 디버깅을 돕는 AI 도구입니다. 또한 마이그레이션과 데이터 분석까지 지원해 운영 효율을 높였습니다.


업스테이지 컨소시엄이 정부 독자 AI 모델 1차수 평가를 통과한 과정을 소개했습니다. 래블업과의 협업으로 인프라를 최적화하고 학습 효율과 장애 대응을 크게 개선했습니다.


GitHub Spec Kit 기반 SDD 프로세스를 소개하며 명세를 중심으로 AI와 협업하는 흐름을 정리했습니다. 4단계 워크플로우와 TDD·BDD 비교, 로그인 예시까지 함께 설명했습니다.


보이스피싱 차단 앱 6종을 기능별로 나누어 비교했습니다. 목적에 따라 AI 통화 관리, 악성앱 점검, 발신자 식별 중 필요한 앱을 선택하면 됩니다.


SK플래닛이 OpenAI, 11번가와 함께 AI Tech Talk 세미나를 열고 기술 인사이트를 공유했습니다. OpenAI API 사례와 11번가의 Codex MVP 시연이 함께 소개됐습니다.
FLO가 음악 발견부터 몰입, 팬 경험까지 이어지는 사용자 여정을 확장한 과정을 소개했습니다. 1.2억 곡 라이브러리와 기기 연동, 아티스트 콘텐츠로 청취 경험을 넓혔습니다.

FE 엔지니어들이 React 재단, CSS Day, Claude Code, TypeScript, Vinext 같은 프런트엔드 관련 소식을 소개했습니다.\nNext.js 대안과 성능 개선 사례를 포함한 월간 기술 큐레이션입니다.