Python と NLTK を使用して、いくつかの「目標」タイトルを分析しています。基本的に、人々は「一生懸命働く」、「日の出を見る」などの目標を設定します。私がやりたいことは、各非ストップワードがエントリのリストのどこにどのように表示されるかを確認し、結果をファイルにダンプすることです。「一致」に幅を与えることができることを知っています。これは少し役立ちます (出力から重要でないデータを取り除くのに役立ちます)。
理想的には、コンマからコンマへのコンコーダンスを表示することです (1 つの「目標」エントリはコンマで区切られます)。nltk ではなく検索を使用してこれを行うことができることはわかっていますが、nltk パッケージははるかにエレガントであり、可能であればそれを使用したいと考えています。