pymf
モジュールを使用して、データセットに行列因数分解を適用してみます。pymf
サイトの例で説明されているように、私はを使用non-negative matrix factorization
しているので、いくつかのW
-および-H
行列を取得します。W
-vectorが分散の説明に従って返されることをどのように確認できますか?私はそれをマニュアルで見つけることができませんでした、そして私のすべてのテストでそれはそうでした。すでにソートされている場合は、再度ソートすることは避けたいと思います。
そうでない場合:一般的に最速の方法はありますか?
私はどちらかのようなものを考えました
let X approx= dot(W,H)
for k in arange(0,W[:,0].size):
variance[k] = abs(dot(W[k],H[k])**2
X-variance
また
let X approx= dot(W,H)
variances = var(dot(X,W),axis=0)
?