Random Forest with Grid Search
4
AI 요약

이 글은 AI가 원문을 분석하여 핵심 내용을 요약한 것입니다.

Random Forest with Grid Search

이 게시물은 항공권 예약 데이터셋을 사용하여 랜덤 포레스트 모델을 구현하는 방법에 대해 설명합니다.

주요 단계

  • 데이터셋 로딩 및 시각화
  • 범주형 변수 원-핫 인코딩
  • 훈련 및 테스트 데이터 분할
  • 소수 클래스의 오버샘플링
  • 랜덤 포레스트 모델 적합
  • 모델 성능 검증
  • 하이퍼파라미터 튜닝(그리드 서치)
  • 특징 중요도 분석

결론

이 모델은 84%의 정확도를 달성했으나, 하이퍼파라미터 튜닝 후 F1 점수가 0.366으로 개선되었습니다. 주요 예측 변수는 출발일, 출발지, 비행 시간, 체류 기간 및 판매 채널입니다.

연관 게시글