5

自然言語処理では、名前付きエンティティの認識は、組織、場所、そして最も重要な名前などの名前付きエンティティを認識するという課題です。

これには大きな課題がありますが、私はそれを同義語と呼んでいます。伯爵ドラキュラは実際には同じ人物を指していますが、これがテキストで直接議論されることは決してない可能性があります.

これらの同義語を解決するための最適なアルゴリズムは何でしょうか?


Python ベースのライブラリにこれに関する機能がある場合は、教育を受けたいと思っています。私はNLTKを使用しています。

4

1 に答える 1

6

あなたは、共参照の解決と固有表現のリンクの問題について説明しています。あなたがどちらを意味しているのか完全にはわからないので、個別のリンクを提供しています。

  • 相互参照: Stanford CoreNLPは現在、最高の実装の 1 つを持っていますが、Java です。私はPython バインディングを使用しましたが、あまり満足していませんでした。すべてのデータをスタンフォード パイプラインで一度だけ実行し、処理された XML ファイルを Python にロードすることになりました。明らかに、リアルタイムで処理する必要がある場合、それは機能しません。
  • 名前付きエンティティのリンク: Apache Stanbolと、次のStackoverflow 投稿のリンクを確認してください。
于 2013-04-05T16:30:27.160 に答える