-1

テキストから人の名前を抽出するにはどうすればよいですか?

これにはいくつかのNLPツールキットを適用しました。具体的には、StanfordNERツールキットを使用してテキストから名前を抽出しました。これで、テキストから人の名前を抽出できますが、プログラムで「プログラマー」、「講師」、「エンジニア」などの単語を抽出したい場合、ライブラリはそれらを抽出できませんでした。テキストからこれらを抽出する方法はありますか?

4

1 に答える 1

1

「プログラマー、講師、エンジニア」は名前の付いたエンティティではないため、これらの単語のリストを維持する必要がある場合があります。「歌う」(動詞)と「歌手」、「講義」(動詞)と「講師」(名詞)など、Wordnetの単語派生関係から取得できると思います。

SuperSenseタガーはNERとしても使用できます。あなたが言及した単語に、必要な「noun.person」というタグを付けることができると思います。ArkRef(Java)はそれを使用する共参照ツールであり(スーパーセンスタガーのJavaポートを介してバンドルされています)、そこにオンラインデモがあるので、ターゲットの単語が角括弧でタグ付けされているかどうかを確認できます。

于 2012-03-05T04:32:31.913 に答える