7

DBPedia スポットライトが特定のドキュメントで名前付きエンティティの認識を行うことを理解しています。そのために、ファイル システムに保存されているダウンロード済みの DBPedia ファイルを使用します。URL を参照してください: https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR

私が必要としているのは、Freebase のスポットライトのような同等の API です。私が閲覧した限り、Freebase トリプル ストアで動作するツール/API は見つかりませんでした。誰かが助けてくれますか?

4

1 に答える 1

3

現在、Freebase で固有表現を認識できる同等のプロジェクトはありません。ただし、Freebase にはsameAs.orgの DBpedia へのリンクがあるため、DBpedia スポットライトを使用して ID を解決して Freebase に戻すことができます (そのデータはFreebase RDF ダンプでも入手できます)。

この分野のコーディング プロジェクトを探しているなら、Freebase データを使用してモデルをトレーニングできるように、DBpedia Spotlight コードを適応させることができるはずです。これの主な利点は、Freebase が DBpedia よりも幅広い範囲のエンティティをカバーするため、よりよく思い出せることです。また、「注目すべき型」などの Freebase の他のデータを利用して、精度を高めることもできます。

Freebase の /type/object/name プロパティと /common/topic/alias プロパティを調べることで、エンティティの「サーフェス フォーム」の適切なセットを取得できるはずです。ウィクペディアのページに対応するすべての Freebase エンティティは、/wikipedia/en 名前空間に 1 つ以上の /type/object/key 値を持ちます。これらはウィキペディアのページ名 (およびリダイレクト) に対応しており、ウィキペディアの XML ダンプを解析して、ページ上のどのリンクが Freebase トピックに対応しているかを識別できます。Freebase のキー エンコーディング スキームについては、こちらで説明しています。

名前付きエンティティの認識をサービスとして提供し、API 応答で Freebase ID を提供するOpenCalaisAlchemyAPIにも興味があるかもしれません。

于 2013-12-27T07:37:27.657 に答える