Semi-supervised learning 방법론 소개
AI
Semi-supervised learning 방법론 소개
두줄요약
준지도학습의 기본 개념과 주요 가정, 대표 기법들을 정리한 소개 글입니다. 레이블 부족 문제를 줄이는 방법이지만, 데이터와 모델 특성에 맞는 선택이 중요했습니다.
핵심 내용
- 준지도학습(SSL)의 개념과 지도학습·비지도학습과의 차이 정리
- 레이블 데이터 부족과 라벨링 비용 증가로 SSL이 필요해진 배경 설명
- smoothness, low-density, manifold, cluster 가정과 SSL 방법론 분류 소개
- self-training, entropy minimization, consistency regularization, VAT, mixup, MixMatch의 개요와 적용 흐름 정리
주의할 점
- SSL이 항상 성능 향상을 보장하지는 않음
- 데이터 분포와 모델 가정이 맞지 않으면 오히려 성능 저하 가능
- 문제 도메인과 모델 특성에 맞는 기법 선택 필요
적용해볼 점
- 적은 레이블과 많은 비레이블 데이터를 함께 활용하는 학습 전략 검토
- 이미지, 그래프 등 도메인별 유사도와 perturbation 특성 고려
- 기존 모델과 잘 맞는 SSL 확장 방식 우선 검토
