非常に大きな行列で k-means クラスタリングを実行しようとしています。
マトリックスは約 500000 行 x 4000 列ですが、非常にまばらです (行ごとに "1" の値が 2 つだけ)。
全体がメモリに収まらないので、スパース ARFF ファイルに変換しました。しかし、R は明らかにスパース ARFF ファイル形式を読み取ることができません。また、データをプレーンな CSV ファイルとして持っています。
このようなスパース行列を効率的にロードするために R で利用できるパッケージはありますか? 次に、クラスター パッケージの通常の k-means アルゴリズムを使用して続行します。
どうもありがとう