機械学習モデルの性能評価において、データ分割の設計と評価指標の選択は、汎化性能の推定精度を大きく左右する重要な要素である。本稿では、訓練・検証・テスト分割の役割、交差検証の各種手法、および分類・回帰タスクにおける評価指標について調査・考察してみました。過学習検出から不適切な分割がもたらすバイアスまで、実践的な観点から検討します。参考になれば幸いです。
続きを読む