Java で JWNL と JAWS の 2 つのライブラリを見つけました。これまでのところ、これらの API は synset やハイポニムなどを見つけるのに適しているように思えます。wordnet を使用して、名詞が可算名詞か不可算名詞かを調べるツールがあるかどうか知っていますか? つまり、人々はこのタスクにワードネットを使用していますか? 他に、ツールは何ですか?
1398 次
2 に答える
1
簡単なソースが見つからない場合は、独自の分類子を作成することを検討できます。独自のユーザー定義関数を作成します。
考慮すべき要素:
- 数えられない名詞と数えられる名詞を (U) と (C) とマークする英語の辞書がいくつかあり、どこかでオンラインで見つけることができるかもしれません。
- 巨大なコーパスのバイグラムを調べて、名詞が可算または不可算の意味で使用されているかどうかを確認できます:
one boy
orthis boy
orthat boy
butsome food
ora little bit of food
etc. - 考慮しなければならない多くのコーナーケースがあります:
I'd like some coffee
vsI'd like a coffee
(一杯のコーヒーの略)。複雑になります。
この SO の質問は非常に関連性がありますが、Java リクエストには対応していません。その質問に対する 3 つの回答はすべて非常に優れています。
お役に立てれば。
于 2012-11-28T22:44:16.073 に答える
0
私はあなたが何をしようとしているのか 100% 肯定的ではありませんが、WolframAlphaには、あなたが使用できるかもしれない開発者インターフェースがあります。
また、無料版は 2k クエリに制限されているように見えますが、既にJava ライブラリを持っているようです (それが実現可能な制限かどうかはわかりません)。
于 2011-06-20T20:16:02.097 に答える