

DeepSeek-R1 기술 분석
DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.


DeepSeek-R1의 구조와 학습 방식, GRPO와 지식 증류의 특징을 OpenAI o1과 비교해 정리했습니다. 비용 절감과 추론 성능 강점, 한국어 적용 시 주의점도 함께 살펴봤습니다.

LLM as a Judge를 활용해 CodeBuddy의 성능 평가를 다룬 글입니다. AI 모델과 응답 품질을 평가하는 방법론을 소개했습니다.


Amazon Bedrock 사용자 지정 모델로 DeepSeek-R1 Distill Llama를 배포하는 방법을 안내했습니다.\n서버리스 호스팅, 비용 구조, 버전 관리와 모니터링 포인트도 함께 정리했습니다.


LLM 기반 AI 에이전트의 Tool Calling 한계를 Code Interpreter로 확장하는 흐름을 설명했습니다. Docker 샌드박스와 LangGraph로 안전하게 적용하는 예시도 함께 다뤘습니다.


자연어 검색 에이전트의 품질을 높이기 위해 Entity RAG와 Knowledge-aware retrieval을 적용한 사례를 소개했습니다. 신규 개체 인식과 테마 질의 대응 성능이 개선되었고, 향후 적용 범위 확대도 제시했습니다.


Amazon Bedrock의 지연 시간 최적화 추론이 LLM 응답성 개선에 어떻게 기여하는지 정리했습니다. TTFT, OTPS, E2E 지표와 함께 프롬프트·아키텍처 최적화 방법도 살펴보았습니다.

RAG와 LangChain, LangGraph의 역할과 구조를 비교해 AI Agent 개발 관점을 정리했습니다. 빠른 개발에는 LangChain, 복잡한 워크플로우에는 LangGraph가 적합하다고 설명했습니다.


HTML 문서에서 실시간으로 본문만 빠르게 추출하기 위한 PAAS의 로직을 소개했습니다. 트리 구조 feature와 entropy를 활용해 노이즈를 줄이면서 핵심 정보 유실을 막았습니다.

카카오가 서비스 적용에 최적화한 언어모델 Kanana의 테크니컬 리포트를 공개했습니다. 높은 성능, 비용 효율성, 안전성을 함께 고려한 자체 AI 모델 방향을 소개했습니다.

LLM으로 중고 스마트폰 게시글에서 시세 산정용 정보를 추출하고 후처리하는 서비스를 구축했습니다. BigQuery, MySQL, 벡터 DB를 조합해 시세 조회와 유사 게시글 추천을 구현했습니다.


Cursor의 Rules 기능으로 iOS 개발용 AI 동작을 프로젝트 단위로 제어하는 방법을 소개했습니다. 규칙을 적용한 뒤 오류와 중복 작업이 줄어든 경험도 공유했습니다.


SK하이닉스가 AWS 환경에서 RAG 플랫폼을 구축하고 성능을 평가한 사례를 소개했습니다. 데이터셋 크기와 인덱스 메모리가 검색 지연과 TTFT에 미치는 영향을 분석했습니다.