Kaggle コンペティションで LSA を実行するために使用する予定sklearn.decomposition.TruncatedSVD
です。SVD と LSA の背後にある数学は知っていますが、scikit-learn のユーザー ガイドに混乱しているため、実際に適用する方法がわかりません
TruncatedSVD
。
ドキュメントでは、次のように述べています。
この操作の後、
U_k * transpose(S_k)
特徴を含む変換されたトレーニング セットです ( API でk
呼び出されます)n_components
どうしてこれなの?私はSVDの後に、、、X
この時点X_k
ですべきだと思いましたU_k * S_k * transpose(V_k)
か?
そして、それは言う、
テスト セット も変換する
X
には、次の値を掛けますV_k
。X' = X * V_k
これは何を意味するのでしょうか?