java - Java での svd の問題

Question

私はジャマとコルト（Javaでコードを書いています）を経験しました。どちらも、行数が列数よりも多くなるような配列を使用することを期待しています。

しかし、潜在的意味解析 (LSA) の場合、5 冊の本があり、合計 1000 の奇妙な単語があります。用語ドキュメントマトリックスを使用すると、5*1000 マトリックスが得られます。

これは機能しないため、行列を転置する必要があります。転置では 1000 * 5 を使用します。1000*5 で svd を実行すると、 5*5 の S 行列が得られます。次元削減を実行するには、この 5*5 行列は小さく見えます。

何ができますか？

score 0 · Accepted Answer

使用しているテキストセグメントのサイズが大きすぎます。ドキュメント (コラム) は、テキストの 1 ページまたは数ページ、最大で 1 章を表す必要があります。段落サイズも使用されているのを見てきました。

1 に答える 1