python - 疎行列の scikit-learn 非負行列分解 (NMF)

Question

Scikit-learn の非負行列因数分解 (NMF) を使用して、ゼロエントリにデータが欠落している疎行列で NMF を実行しています。Scikit-learn の NMF 実装がゼロのエントリを 0 または欠落データと見なすかどうか疑問に思っていました。

ありがとうございました！

score 1 · Accepted Answer

データマトリックスでは、欠損値が 0 になる可能性がありますが、非常にまばらなマトリックスに多数のゼロを格納するのではなく、通常、各行が CSR 形式で格納される COO マトリックスを格納します。

推奨に NMF を使用している場合は、3 つの行列すべてが非負であるという条件で、WH が X にほぼ等しくなるような W と H を見つけることによって、データ行列 X を因数分解します。この行列 X を再構築すると、欠落している値 (ゼロを格納していたはずの場所) の一部が非ゼロになり、一部がゼロのままになる場合があります。この時点で、再構築されたマトリックスの値は予測です。

あなたの質問に答えるために、それらは 0 ですか、それとも NMF モデルのデータが欠落していますか? 適合した NMF モデルには予測値が含まれるため、ゼロとしてカウントします。これは、データの欠損値を予測する方法です。

python - 疎行列の scikit-learn 非負行列分解 (NMF)

2 に答える 2

Related

Reference