トレーニング セットにゼロでいっぱいの列や行がないことを確認しながら、スパース マトリックスを同じ次元のトレーニング データとテスト データにランダムに分割したいと考えています。
私のアルゴリズムが機能するには、トレーニング セットの各行と列に少なくとも 1 つの値が必要です。
このライブラリ関数を使用しようとしました: from sklearn.model_selection import train_test_split
たとえば、次の行列が与えられます。
[[0, 1, 3, 1],
[0, 0, 0, 1],
[8, 0, 0, 1]]
マトリックスを分割して、次のトレーニング マトリックスを作成できます。
[[0, 1, 0, 1],
[0, 0, 0, 0],
[0, 0, 0, 8]]
2 行目には 0 のみが含まれます。どうすればこれを回避できますか?