

LLM 품질 테스팅 시작하기
LLM과 sLLM의 자체 품질 평가 필요성을 정리하고, 리더보드 사례와 함께 LLM을 활용한 평가 프로세스를 설계한 글입니다. 프롬프트 일관성과 평가 기준 관리 같은 운영 과제도 함께 다뤘습니다.


LLM과 sLLM의 자체 품질 평가 필요성을 정리하고, 리더보드 사례와 함께 LLM을 활용한 평가 프로세스를 설계한 글입니다. 프롬프트 일관성과 평가 기준 관리 같은 운영 과제도 함께 다뤘습니다.

구글 머신러닝 부트캠프 2024 5기 졸업식과 함께 참가자들의 성과가 공유되었습니다. DLS, 캐글, 젬마 프로젝트를 통해 학습과 협업의 경험을 쌓았습니다.
![[10월 4주차 위클리 업데이트] 이번 주 발표된 Google for Developers 최신 소식을 확인하세요! (#TheAndroidShow, Firebase Demo Day 2024)](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEjNGleuvh_5ifDsOtW0kzXLCkvY7XYc-F06GUikEOdMjiDeZsbnDjz7RhXeyMREp6l4AX_VrQECkz67VDXvH2KJwDtPG8qlSCJiMy9yu3ttxNDMKwl8e_ukSr63dHzE44eKCWEslxqyNog/s1600/lockup_google_developers_horizontal_knockout_wht.png)
Google for Developers의 10월 4주차 최신 소식과 주요 블로그 업데이트, 이벤트를 소개했습니다.\n관심 있는 제품군의 문서와 행사 정보를 확인해보시면 좋습니다.

X

카카오 CTO가 if(kakaoAI)2024에서 AI Native 전략을 소개했습니다. AI를 문화와 서비스 전반에 내재화하려는 방향을 제시했습니다.

X


생성 AI와 LLM이 자동차에 들어오며 차량 상태 안내, 대화형 어시스턴트, 경로 추천 같은 개인화 기능이 확장되고 있습니다. 또한 비전과 LLM 결합으로 자율주행과 실내 인식의 정확도를 높일 가능성을 보여줍니다.

삼성 리서치와 Team Atlanta가 DARPA AIxCC에 참가해 생성형 AI 기반 사이버 추론 시스템을 다뤘습니다. 본문은 오류 화면 때문에 상세 내용 확인이 어려웠습니다.

언어 모델의 fine-tuning 성능을 높이는 LoRA, TAPT, DAPT, Adversarial Training을 소개했습니다. 대규모 전체 학습보다 비용과 효율을 고려한 적용 방향을 정리했습니다.

Gen AI를 연구 기술이 아닌 사용자 관점에서 바라본 SW 개발자의 생각을 다룬 글입니다. 다만 본문이 중간에서 끊겨 구체적 내용은 충분히 확인되지 않았습니다.

뉴스 정보를 이용해 고용률 변화를 예측하는 멀티모달 모델 개발 과정을 소개했습니다. 이번 글에서는 고용 기사 분류와 감정 분석을 위한 KoELECTRA 기반 설계를 다뤘습니다.