私はメールを解析する Python スクリプトを書いています。これには、メールのテキストから一般的な食品である単語を検索することが含まれます。言葉が本当に食べ物かどうかを判断する方法が必要です。
いくつかの自然言語処理 API (AlchemyAPI や NLTK 2.0 など) を調べたところ、Named Entity Extraction (これが必要です) があるようですが、特に食品のエンティティ タイプが見つかりません。
私が必要としているものに対して、自然言語処理が過剰である可能性は十分にあります。私が必要としているのは、一致する食品のリストだけです。そのような単語リストはどこにありますか? 独自のスクレーパーを作成してオンライン ソースから解析する必要がありますか?それとももっと簡単な方法がありますか?