Kaggle コンペティションで LSA を実行するために使用する予定sklearn.decomposition.TruncatedSVDです。SVD と LSA の背後にある数学は知っていますが、scikit-learn のユーザー ガイドに混乱しているため、実際に適用する方法がわかりません
TruncatedSVD。
ドキュメントでは、次のように述べています。
この操作の後、
U_k * transpose(S_k)特徴を含む変換されたトレーニング セットです ( API でk呼び出されます)n_components
どうしてこれなの?私はSVDの後に、、、Xこの時点X_kですべきだと思いましたU_k * S_k * transpose(V_k)か?
そして、それは言う、
テスト セット も変換する
Xには、次の値を掛けますV_k。X' = X * V_k
これは何を意味するのでしょうか?
