単語のリストがあり、それをフィルタリングして、その単語のリストから名詞のみを取得したい (Java を使用)。これを行うために、単語のデータベースにそのタイプを照会する簡単な方法を探しています。
私の質問は、単語の意味定義ではなく、単語のクラスを見つけることができる、無料で簡単な単語検索 API を知っている人はいますか?
ありがとう!
ベン。
編集:言葉のクラスによって、私は「品詞」を意味しました これを片付けてくれてありがとう
単語のリストがあり、それをフィルタリングして、その単語のリストから名詞のみを取得したい (Java を使用)。これを行うために、単語のデータベースにそのタイプを照会する簡単な方法を探しています。
私の質問は、単語の意味定義ではなく、単語のクラスを見つけることができる、無料で簡単な単語検索 API を知っている人はいますか?
ありがとう!
ベン。
編集:言葉のクラスによって、私は「品詞」を意味しました これを片付けてくれてありがとう
あなたが探しているのは、単語の品詞 (POS) だと思います。一般に、文の文脈を除いて、それを決定することはできません。いくつかの異なる潜在的な品詞を持つことができる多くの単語があります (たとえば、'bank' は動詞または名詞として使用できます)。
POS タガーを使用して、必要な情報を取得できます。ただし、次の品詞タガーは、よく構造化された英文内の単語にタグを付けていることを前提としています...
OpenNLP Java ライブラリは一般的に非常に優れており、LGPL でリリースされています。ディストリビューションに含まれる英語および他のいくつかの言語用の品詞タガーがあります。プロジェクト ページにアクセスして jar を取得するだけです (モデルもダウンロードすることを忘れないでください)。
また、GPL の下で Java で書かれたStanford の品詞 taggerもあります。私はこのライブラリを直接使用したことはありませんが、スタンフォード NLP ラボは概して非常に優れています。
単語のデータベースを照会すると、Ben S.が言及する問題が発生します。たとえば、リード(v。道を示す)またはリード(n。Pb)です。問題に時間をかけたい場合は、品詞のタグ付けを参照してください。別のSOスレッドにいくつかの良い情報があります。
英語の場合、WordNet を使用可能な Java APIの 1 つと共に使用して、単語の字句カテゴリを見つけることができます(NLP では、最も一般的に品詞と呼ばれます)。専用のPOS タガーを使用することも別のオプションです。