AI를 활용한 고용률 예측 모델 개발기(2)
AI
AI를 활용한 고용률 예측 모델 개발기(2)
두줄요약
뉴스 감정 정보와 과거 고용률 데이터를 결합해 고용률 현재 예보 모델을 개발한 과정을 소개했습니다. PCA, 데이터 증강, Transformer 적용으로 성능을 개선했으며 특수 사건 대응 과제도 함께 정리했습니다.
핵심 내용
- 뉴스 기사 감정 정보와 과거 고용률 데이터를 결합해 미래 고용률을 현재 예보하는 모델 개발 과정
- 고용률의 주기성과 뉴스의 시의성을 반영하기 위해 서로 다른 입력 기간을 설정
- Transformer encoder 기반의 감정 모델과 고용률 정보 모델을 결합해 예측값 도출
적용해볼 점
- 감정 임베딩 차원 축소를 위해 PCA 적용
- 적은 데이터 문제 보완을 위해 날짜 sin/cos 변환, offset 부여, 데이터 증강, 일 단위 보간 활용
- 시계열 학습에서 RNN 대신 self-attention 기반 Transformer 사용 검토
성능/운영 포인트
- 학습/테스트는 시계열 특성을 고려한 out-of-sample 분할 사용
- 전체 테스트 구간 상관계수 0.5934, 코로나 이전 구간에서는 0.9304 기록
- 특수 사건 구간에서는 오차가 커질 수 있어 이상 탐지와 신뢰도 표시 보완 필요
