トレーニング セットは、サンプルのセットとサンプルごとに 1 つのラベルのセットから作成されます。私の場合、サンプルはベクトルですが、ラベルはスカラーです。これに対処するために、Numpy を使用します。次の例を検討してください。
samples = np.array([[1,0],[0.2,0.5], [0.3,0.8]])
labels = np.array([1,0,0])
ここで、要素をシャッフルする 2 つのパーティションにトレーニング セットを分割する必要があります。この事実は問題を提起します: 私はラベルとの対応を失います. どうすればこれを解決できますか?
私のプロジェクトではパフォーマンスが重要であるため、順列ベクトルを構築したくないので、ラベルをサンプルにバインドする方法を探しています。今では私の解決策は、サンプル配列の最後の列を次のようにラベルとして使用することです。
samples_and_labels = np.array([[1,0,0],[0.2,0.5,0], [0.3,0.8,1]])
これは私の場合の最速の解決策ですか? それとも他に良いものはありますか?たとえば、ペアを作成しますか?