私が読んだことから、相互検証は次のように実行されると常に考えてきました。
k分割交差検定では、元のサンプルがランダムにk個のサブサンプルに分割されます。k個のサブサンプルのうち、1個のサブサンプルがモデルをテストするための検証データとして保持され、残りのk −1個のサブサンプルがトレーニングデータとして使用されます。次に、交差検定プロセスがk回繰り返され(フォールド)、k個のサブサンプルのそれぞれが検証データとして1回だけ使用されます。次に、フォールドからのkの結果を平均化(またはその他の方法で組み合わせ)して、単一の推定値を生成できます。
したがって、k個のモデルが作成され、最後のモデルはそれらの平均です。Wekaのガイドでは、各モデルは常にすべてのデータセットを使用して構築されると書かれています。では、Wekaでの相互検証はどのように機能しますか?モデルはすべてのデータから構築されており、「相互検証」とは、k分割が作成され、各分割が評価され、最終的な出力結果が単純に分割の平均結果になることを意味しますか?