非常に巨大なマトリックス(100Gbを超える約300.000x100.000の値)でk-meansクラスタリングを実行する必要があります。Rソフトウェアを使用してこれまたはwekaを実行できるかどうかを知りたいです。私のコンピューターは、8GbのRAMと数百Gbの空き容量を備えたマルチプロセッサーです。
計算に十分なスペースがありますが、そのようなマトリックスのロードはRの問題のようです(bigmemoryパッケージを使用しても、十分なスペースがない場合は、すべてのRAMとスワップファイルを自動的に使用するのに役立つとは思いません)。
だから私の質問は:どのソフトウェアを使うべきか(最終的には他のパッケージやカスタム設定と組み合わせて)です。
私を助けてくれてありがとう。
注:私はLinuxを使用しています。