1

単語のリストがあり、それをフィルタリングして、その単語のリストから名詞のみを取得したい (Java を使用)。これを行うために、単語のデータベースにそのタイプを照会する簡単な方法を探しています。

私の質問は、単語の意味定義ではなく、単語のクラスを見つけることができる、無料で簡単な単語検索 API を知っている人はいますか?

ありがとう!

ベン。

編集:言葉のクラスによって、私は「品詞」を意味しました これを片付けてくれてありがとう

4

4 に答える 4

3

単語の種類?動詞、名詞、形容詞など?その場合、一部の単語が複数の方法で使用される可能性があるという問題が発生する可能性があります。例:「そのカードを交換してくれませんか?」、「それは悪い取引でした。」

いくつかの提案については、このスレッドを参照してください。

これも見てください、あなたが探しているものを正確に実行するかもしれないようです。

于 2009-03-04T19:43:50.437 に答える
2

あなたが探しているのは、単語の品詞 (POS) だと思います。一般に、文の文脈を除いて、それを決定することはできません。いくつかの異なる潜在的な品詞を持つことができる多くの単語があります (たとえば、'bank' は動詞または名詞として使用できます)。

POS タガーを使用して、必要な情報を取得できます。ただし、次の品詞タガーは、よく構造化された英文内の単語にタグを付けていることを前提としています...

  • OpenNLP Java ライブラリは一般的に非常に優れており、LGPL でリリースされています。ディストリビューションに含まれる英語および他のいくつかの言語用の品詞タガーがあります。プロジェクト ページにアクセスして jar を取得するだけです (モデルもダウンロードすることを忘れないでください)。

  • また、GPL の下で Java で書かれたStanford の品詞 taggerもあります。私はこのライブラリを直接使用したことはありませんが、スタンフォード NLP ラボは概して非常に優れています。

于 2009-03-11T08:00:04.347 に答える
0

単語のデータベースを照会すると、Ben S.が言及する問題が発生します。たとえば、リード(v。道を示す)またはリード(n。Pb)です。問題に時間をかけたい場合は、品詞のタグ付けを参照してください。別のSOスレッドにいくつかの良い情報があります。

于 2009-03-05T03:38:07.553 に答える
0

英語の場合、WordNet を使用可能な Java APIの 1 つと共に使用して、単語の字句カテゴリを見つけることができます(NLP では、最も一般的に品詞と呼ばれます)。専用のPOS タガーを使用することも別のオプションです。

于 2009-03-05T03:56:31.050 に答える