인공지능 음성 생성 연구 - 음성 분류 솔루션
AI
인공지능 음성 생성 연구 - 음성 분류 솔루션
두줄요약
재난 상황 음성 분류 문제를 드론 소음 환경에 맞게 이미지 분류 방식으로 풀었습니다. AI Hub 데이터와 전이학습을 활용해 2021 인공지능 그랜드 챌린지 1위를 달성했습니다.
핵심 내용
- 버추얼 휴먼 음성 생성 연구를 위한 음성 신호 처리 솔루션 소개
- 드론 소음이 큰 재난 상황 음성 분류 문제를 이미지 분류 방식으로 전환해 풀이
- AI Hub 데이터, 기존 대회 산출물, 직접 녹음 데이터를 활용해 학습 데이터 구성
- wav를 mel spectrogram 이미지로 변환하고 big-transfer 모델로 전이학습 수행
