私はテキスト分類の感情分析に取り組んでおり、Twitter からのツイートをポジティブ、ネガティブ、またはニュートラルの 3 つのカテゴリに分類したいと考えています。210 個のトレーニング データがあり、分類器として Naive Bayes を使用しています。トレーニング データのデータベースとして PHP と MySQL を使用して実装しています。私がやったことは順番にあります:
- 10-fold Cross Validationに基づいて、トレーニング データを 189 のトレーニング データと 21 のテスト データに分割しました。
- トレーニング データをデータベースに挿入して、分類子がトレーニング データに基づいて分類できるようにします。
- 次に、分類子を使用してテスト データを分類します。21件の予測結果が得られました。
- 10 分割交差検証に基づいて、手順 2 と 3 を 10 回繰り返します。
- 分類器の精度を 1 つずつ評価したので、10 個の精度結果が得られました。次に、結果の平均を取ります。
私が知りたいのは:
- 学習プロセスはどれですか? インプット、プロセス、アウトプットとは?
- 検証プロセスはどれですか? インプット、プロセス、アウトプットとは?
- テストプロセスはどれですか? インプット、プロセス、アウトプットとは?
これら 3 つのプロセス (学習、検証、およびテスト) に関する私の理解が正しいものであることを確認したいだけです。