

LLM은 언제 "모른다"고 말해야 하는가
LLM은 정답을 맞히는 능력만큼, 모를 때 멈추는 능력도 중요하다고 정리했습니다. 모델 크기나 추론 강화만으로는 부족해, 별도의 평가와 정렬 설계가 필요했습니다.


LLM은 정답을 맞히는 능력만큼, 모를 때 멈추는 능력도 중요하다고 정리했습니다. 모델 크기나 추론 강화만으로는 부족해, 별도의 평가와 정렬 설계가 필요했습니다.


Palantir FDE를 소프트웨어를 만드는 역할이 아니라 현실에서 작동시키는 실행 역할로 설명했습니다. PoC를 운영과 채택으로 연결해야 실제 비즈니스 임팩트가 난다고 정리했습니다.

네이버 통합검색의 장애 대응을 위해 LLM Devops Agent를 설계하고 평가한 사례를 소개했습니다. v1의 한계를 바탕으로 v2 구조와 이상 탐지, 알람·액션 추천 방향을 공유했습니다.


디퓨전 방식 언어모델 LLaDA의 학습·추론 구조와 reversal curse 완화 가능성을 다뤘습니다. 코드 FIM 태스크에서의 잠재력과 추론 효율 한계도 함께 정리했습니다.


한국어 감성 리뷰를 Keras로 이진 분류하는 전처리와 모델 구조를 설명했습니다. Okt 형태소 분석, BiLSTM, 콜백을 활용한 학습과 예측 흐름을 다뤘습니다.


강의와 회의 기록용 AI 음성 앱 4종을 실제 강의 파일로 비교했습니다. 한국어 인식과 요약 기능은 에이닷 노트와 클로바 노트가 특히 강했습니다.


국내 AI 노트 서비스 4종의 전사, 요약, 다국어, 협업 기능을 비교했습니다. 용도에 맞게 선택하면 회의록과 학습 정리를 더 효율적으로 할 수 있습니다.


Attention 메커니즘의 개념과 필요성을 설명하고, Q/K/V 기반 작동 흐름을 정리했습니다. 또한 PyTorch와 TensorFlow 예제로 실제 구현 방법을 보여주었습니다.


LLM 기반 Text-to-SQL의 오류 유형과 빈도를 정리하고, 기존 수리 방식의 한계를 분석했습니다. 규칙 기반 감지와 LLM 보조 수정을 결합한 MapleRepair의 실무적 효과를 소개했습니다.

Kanana 언어모델에 추론 기능을 붙이는 Kanana-1.5를 소개하는 글입니다. OpenAI o1 출시를 계기로 추론형 언어모델 흐름을 다룹니다.


에이닷에 Agentic Memory를 도입해 대화를 구조화된 기억으로 저장하고 개인화 응답을 강화했습니다. 비동기 처리와 DSPy 최적화로 성능과 유지보수성도 함께 높였습니다.


GPT의 핵심 구조인 트랜스포머 디코더와 Self Attention 흐름을 수식 없이 설명했습니다. 입력 벡터화부터 다음 단어 예측까지의 과정을 단계별로 정리했습니다.