コロケーション (n-gram) を見つけるために NLTK を使用してきましたが、最近、NLP の spaCy モジュールを発見しました。私はそれに慣れ始めたばかりで、これまでのところ、サポートされているコロケーション関数についてはほとんど言及されていません。
spaCy を使用してコロケーションを直接見つけることはできますか?
ドキュメントを読みましたが、言及されていません。
コロケーションの検出は、依存関係の解析に基づくこともできますが、spaCy はそれをサポートしていません。アプローチの一部として spaCy を使用できますが、直接使用することはできません。
gensim もご検討いただけますでしょうか: https://radimrehurek.com/gensim/models/phrases.html
お役に立てれば幸いです