問題タブ [natural-language-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ドキュメント内の意味のある単語のペアを見つけるための Python ツール
Twitter からツイートを収集し、テキストを評価してトレンド トピックを見つけるプログラムを作成しています。NLTK を使用して用語を抑止し、データに対して他の操作を行うことを計画しています。
私が必要としているのは、ツイート内の隣接する 2 つの単語を 1 つの用語として扱うべきかどうかを判断できるツールです。たとえば、Twitter で「フェイク ニュース」がトレンドになっている場合、この 2 つの単語を別のものとして扱いたくありません。別の例として、誰もが「コンピューター サイエンス」についてツイートしている場合、コンピューターと科学は同じトピックを参照しているため、2 つの異なる用語として扱うのは意味がありません。そのような用語を見つけることができるツールは存在しますか?