Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
多くのフォルダーに保存されているドキュメントのリストからDocument x Wordマトリックスを作成したいと思います。マトリックス内の特定のエントリxは、 word_jがdocument_i内でx回出現することを示します。考慮すべき単語のリストは、Vocabulary.txt ファイルに記載されています。 ドキュメントを 1 つずつスキャンし、ストップ ワードを削除してドキュメント ベクトルを構築する既存のパッケージはありますか?