0

多くのフォルダーに保存されているドキュメントのリストからDocument x Wordマトリックスを作成したいと思います。マトリックス内の特定のエントリxは、 word_jdocument_i内でx回出現することを示します。考慮すべき単語のリストは、Vocabulary.txt ファイルに記載されています。 ドキュメントを 1 つずつスキャンし、ストップ ワードを削除してドキュメント ベクトルを構築する既存のパッケージはありますか?

4

0 に答える 0