

효율적 시맨틱 검색을 위한 kubernetes GPU inference 시스템 구축하기
Kubernetes에 GPU 기반 Triton 추론 서버를 구축해 시맨틱 검색을 실시간으로 처리한 사례를 정리했습니다. ONNX 최적화와 배치·모니터링·배포 자동화로 성능과 운영 효율을 높였습니다.


Kubernetes에 GPU 기반 Triton 추론 서버를 구축해 시맨틱 검색을 실시간으로 처리한 사례를 정리했습니다. ONNX 최적화와 배치·모니터링·배포 자동화로 성능과 운영 효율을 높였습니다.


Amazon Bedrock과 Amazon OpenSearch로 헤지펀드용 Company Screener Agent를 구현한 사례를 소개했습니다. 금융 특화 임베딩과 하이브리드 검색으로 종목 선별, 요약, 검증을 자동화한 효과를 설명했습니다.


Amazon OpenSearch Service OR1 인스턴스의 내부 구조와 데이터 흐름을 설명했습니다. Amazon S3 기반 원격 저장과 물리 복제로 처리량, 내구성, 복구 효율을 높이는 방식을 다뤘습니다.


Elasticsearch 사각형 공간 검색에서 Box와 Polygon의 성능을 비교했습니다. 두 방식은 큰 차이 없이 유사했으며, 단순 검색에는 Box를 우선 고려할 수 있었습니다.
토스에서 여러 역할을 거치며 성장한 제품 디자이너의 도전 경험을 인터뷰로 소개했습니다. 두려움이 있어도 먼저 맡고, 과거의 성과로 자신을 다독이는 태도를 전했습니다.


지도와 리스트를 하나의 화면에서 자연스럽게 전환하는 하이브리드 뷰를 도입한 과정을 다뤘습니다. 웹 뷰 성능 최적화로 사용자 수와 예약 완료 지표도 개선했습니다.

데이터 사일로와 빅데이터 검색 혁신을 다루는 글입니다. 다만 본문이 Cloudflare 오류로 중간에 끊겨 상세 내용은 확인되지 않았습니다.


실서비스 트래픽을 캡처해 다른 서버에 재생하는 Gor 활용법을 소개했습니다. Canary 배포와 서버 교체 시 사용자 영향 없이 검증하는 방법을 정리했습니다.

Amazon OpenSearch Service의 Multi-AZ with Standby에서 검색과 색인 트래픽이 어떻게 분산되고 전환되는지 설명했습니다. 가중치 라운드 로빈과 영역별 장애 조치로 고가용성과 일관된 성능을 확보하는 방식도 다뤘습니다.

호텔 검색에서 LLM을 sLLM으로 옮기기 위해 지식 증류를 적용한 과정을 다뤘습니다. 성능과 효율을 함께 확보하기 위한 모델 선정, 데이터 구성, 학습 기법 개선을 설명했습니다.

호텔 검색의 언어 장벽과 POI 매칭 한계를 개선한 사례를 다루었습니다. 다국어 음차·번역, Dense Retrieval, Place sLLM으로 커버리지와 검색 품질을 높였습니다.

호텔 검색의 이미지 품질을 높이기 위해 플레이스 특화 CLIP 인코더를 학습했습니다. 질의와 이미지의 연관성을 강화해 대표 이미지 검색 정확도와 사용자 경험을 개선했습니다.