

Amazon Bedrock Vision LLM과 Amazon OpenSearch Service를 활용한 농약 제품 이미지 인식 시스템 구축기
농약 제품 사진을 인식해 정보를 찾는 3단계 AI 검색 시스템을 구축했습니다. Vision LLM 오인식을 오타 보정, OpenSearch Fallback, LLM Reranker로 보완했습니다.


농약 제품 사진을 인식해 정보를 찾는 3단계 AI 검색 시스템을 구축했습니다. Vision LLM 오인식을 오타 보정, OpenSearch Fallback, LLM Reranker로 보완했습니다.


부트텐트는 모집 페이지를 분석해 교육과정 등록 초안을 자동 생성하는 파이프라인을 구축했습니다. 하이브리드 OCR과 검증 에이전트를 적용해 정확도와 비용, 처리 시간을 함께 개선했습니다.
매월 반복되던 무이자 할부 업로드를 AI OCR과 자동 파이프라인으로 전환한 사례입니다. 사람의 최종 승인과 재시도, 슬랙 알림을 더해 운영 리스크를 줄였습니다.

복잡한 PDF를 LLM이 이해하도록 돕는 PaLADIN을 소개했습니다. 표·차트·숫자 처리 아키텍처와 성능 평가, 서비스 적용 사례를 함께 다뤘습니다.
숙박 상품 등록 흐름을 Slack, Google Sheets, OCR, API, Playwright로 자동화했습니다. 온보딩 시간을 10분 내외로 줄이고 반복 오류도 줄였습니다.

생성형 AI와 Flutter로 메뉴 등록 앱 데모를 5일 만에 만든 실험을 소개했습니다. 요구 분해와 반복 수정은 유효했지만, 프로덕션용 안전장치는 부족했습니다.


GS리테일은 Amazon Bedrock으로 와인 라벨 이미지 검색 서비스를 구축했습니다. Claude와 멀티모달 임베딩, Elasticsearch를 결합해 다국어 라벨 검색 품질을 높였습니다.


코오롱몰은 이미지에만 있던 상품 속성을 LLM으로 추출해 검색과 필터에 활용할 수 있게 했습니다. 그 결과 추출 시간과 비용을 크게 줄이고, 사이즈탭 노출과 구매 전환율도 높였습니다.


VLM은 쉬운 공간 관계 문제도 자주 틀리는 한계가 있습니다. 현업 적용 전 정확성과 취약점을 충분히 검토해야 했습니다.


VLM의 개념과 최신 기술 동향, 주요 기업의 개발 흐름을 종합적으로 정리했습니다. 문서 AI 도입 시 특화 모델과 데이터 전략, 인프라 비용을 함께 고려할 필요가 있습니다.


Google Cloud Vision API로 OCR을 수행하는 방법을 정리했습니다. API Key 방식과 서비스 계정 인증 방식을 비교하며 Colab에서의 사용법을 소개했습니다.

Selenium과 OCR을 결합해 스마트 디스플레이 제어를 자동화한 사례를 소개했습니다. Docker와 클라우드로 대규모 디지털 사이니지 마이그레이션 확장성을 높였습니다.