Scikit-learn の非負行列因数分解 (NMF) を使用して、ゼロ エントリにデータが欠落している疎行列で NMF を実行しています。Scikit-learn の NMF 実装がゼロのエントリを 0 または欠落データと見なすかどうか疑問に思っていました。
ありがとうございました!
Scikit-learn の非負行列因数分解 (NMF) を使用して、ゼロ エントリにデータが欠落している疎行列で NMF を実行しています。Scikit-learn の NMF 実装がゼロのエントリを 0 または欠落データと見なすかどうか疑問に思っていました。
ありがとうございました!
データ マトリックスでは、欠損値が 0 になる可能性がありますが、非常にまばらなマトリックスに多数のゼロを格納するのではなく、通常、各行が CSR 形式で格納される COO マトリックスを格納します。
推奨に NMF を使用している場合は、3 つの行列すべてが非負であるという条件で、WH が X にほぼ等しくなるような W と H を見つけることによって、データ行列 X を因数分解します。この行列 X を再構築すると、欠落している値 (ゼロを格納していたはずの場所) の一部が非ゼロになり、一部がゼロのままになる場合があります。この時点で、再構築されたマトリックスの値は予測です。
あなたの質問に答えるために、それらは 0 ですか、それとも NMF モデルのデータが欠落していますか? 適合した NMF モデルには予測値が含まれるため、ゼロとしてカウントします。これは、データの欠損値を予測する方法です。