3

Freebase ダンプ内のすべての名前付きエンティティとそのタイプを抽出しようとしています。

特定のトピックの Freebase データ ダンプを抽出する方法を見てきましたが 、Freebase ダンプで実際の名前付きエンティティを取得できませんでした。

私はこのような情報を取得しようとしています, 名前: バラク・オバマ タイプ: 人名: ニューヨーク タイプ: 都市など..

Freebase はすでにこれらすべてのエンティティをデータベースに持っていますが、すべてのエンティティとそのタイプをリストする Freebase API または Google API が見つかりませんでした。

手伝っていただけませんか。

ありがとう

4

1 に答える 1

3

データ ダンプの形式については、こちらで説明しています。あなたが参照している回答を書いてからいくつか変更されましたが、基本的な原則は同じです。

MQLread APIとSearch APIの両方を使用して、Freebase トピックを特定のタイプ (/people/person タイプなど) にフィルターすることができます。トピックには複数のタイプを含めることができますが、クラシック NER タイプが必要な場合は、最初に必要なタイプでフィルタリングする必要があります。これは、Freebase には数千万のトピックのうち約 300 万人しかいないためです。 .

Freebase には名前だけでなく、NER タスクで役立つ多くの情報が含まれているため、一歩下がって、他のどのプロパティを抽出する必要があるかを検討することをお勧めします。

于 2014-02-10T15:07:31.577 に答える