ここのコードに従っただけです(sklearn 0.17のマイナーな変更を加えて)。その例では、データは単なるリストまたは numpy 配列です。ここで、おもちゃのトレーニング データセットをディスクに準備し、それを使用datasets.load_files
してマルチラベル分類に読み込みます。ただし、単純にload_files
規則に従って同じファイルを複数のフォルダーにコピーしても、 のリスト (ラベル セット) のリストは作成されませんdataset.target
。
では、マルチラベル分類用にデータセットを準備する正しい方法は何ですか?