私は簡単なレコメンデーションシステムを開発していて、SVD、RBMなどの計算をしようとしています。
さらに説得力を持たせるために、MovielensまたはNetflixデータセットを使用してシステムのパフォーマンスを評価します。ただし、2つのデータセットには両方とも100万を超えるユーザーと1万を超えるアイテムがあり、すべてのデータをメモリに入れることは不可能です。このような大きなマトリックスを処理するには、いくつかの特定のモジュールを使用する必要があります。
SciPyにはこれを処理できるツールがいくつかあることを私は知っています。また、 python-recsysで使用されるdivisi2も良い選択のようです。それとも、私が知らないより良いツールがいくつかありますか?
どのモジュールを使用する必要がありますか?なにか提案を?