半教師あり学習では、ラベル付きデータ(L)のセットを使用してモデルをトレーニングし、ラベルなしデータ(U)のセットを予測してから、新しいラベル付きデータ(L')と元のラベル付きデータ(L)を完全なラベル付きデータとしてグループ化します。データ。
テストデータの抽出方法をお聞きしたいと思います。
- (L union L')からテストデータを抽出する必要があります
- (L)からテストデータを抽出する必要があります
どちらが正しいですか?
テストデータが(L union L')から抽出された場合、L'の答えが間違っている可能性があるため、結果は意味がありません...?
================================================== ========新規編集
私は別の考えを持っています.....
3.最初に、ラベル付けされたデータ(L)をトレーニングデータ(L_train)とテストデータ(L_test)に分割する必要があります。
次に、L_trainを使用してモデルをトレーニングし、それを使用してラベルなしデータのセット(U)を予測し、予測結果(L')とL_trainをグループ化します。
そして、(L_train union L')を使用して、L_testでテストするモデルをトレーニングします。
1,2,3のどちらが正しいですか?返信ありがとうございます。