6

単語が動詞か名詞か、またはその両方かを調べる必要があります

たとえば、単語は「検索」であり、名詞と動詞の両方である可能性がありますが、スタンフォード パーサーはそれに NN タグを付けます..

スタンフォードパーサーが「検索」が名詞と動詞の両方であることを示す方法はありますか?

私が今使っているコード

public static String Lemmatize(String word) {
    WordTag w = new WordTag(word);
    w.setTag(POSTagWord(word));
    Morphology m = new Morphology();
    WordLemmaTag wT = m.lemmatize(w);

    return wT.lemma();
}

または、他のソフトウェアを使用してそれを行う必要がありますか?私に提案してください 事前に感謝します

4

3 に答える 3

8

スタンフォード パーサーは、コンテキスト統計に基づいて単語の品詞タグを推測します。その文で「検索」が名詞なのか動詞なのかを判断するには、実際には完全な文を渡す必要があります。

品詞タグを取得するためだけに完全なパーサーは必要ありません。Stanford POS Taggerで十分です。クラスも含まれMorphologyますが、コンテキストも考慮されます。

文脈を与えずに、英語の単語が取ることができるすべての品詞タグが必要な場合は、WordNetおそらくより良い選択です。JWNLJWIなど、いくつかの Java インターフェイスがあります。

于 2010-10-04T13:33:49.377 に答える
3

WordNetはあなたが望むものです。これは、可能な品詞、同義語、単語の意味、上位語/下位語の関係などを含む英語のレキシコンに API を提供します。

優れたピュア Java WordNet API については、Yawniを参照してください。

于 2010-10-04T13:45:31.733 に答える
1

スタンフォード パーサーは、文のコンテキストで単語を解析します。「検索」の例を使用すると、任意の文で「検索」は名詞または動詞になりますが、同じ文で名詞と動詞の両方ではありません。

あなたが探しているのは、辞書検索です。探している情報が得られるオンライン辞書をいくつか見つけました。これは、「検索」という単語の無料オンライン辞書の例です。

「検索」は、名詞、動詞、自動詞動詞、他動詞のいずれかであることがわかりました。

Free Online Dictionary の Web ページにあるのと同じ種類の情報を提供するアプリケーション プログラミング インターフェイス (API) が見つかりませんでした。語彙リストが限られている場合は、独自の API を構築できます。

于 2010-10-04T13:33:12.230 に答える