2

Predicate が日付/時刻プロパティである SPARQL クエリを使用して、DBPedia エンドポイントからすべての Subject/Predicate/Object を抽出したいと考えています。

ダンプから DBPedia の Infobox プロパティを解析し、このクエリを使用してステートメントをフィルター処理しようとしました。しかし、正しい日付/時刻形式でないオブジェクトがたくさんあります (紀元前 200 年など)。

Dump ファイルまたは DBPedia のエンドポイントにクエリを実行して、すべての有効な日付/時刻ベースのステートメントを解決するにはどうすればよいですか?

4

1 に答える 1

4

前の質問に対する答えは、特定のデータ型でプロパティを取得する方法を示しました。これを拡張して、そのプロパティを使用するステートメントを取得するのは簡単です。そのクエリはバインドされ?pました。?s ?p ?oクエリに追加するだけです。例えば:

select ?s ?p ?o where {
  ?p a owl:DatatypeProperty ;
     rdfs:range xsd:date .
  ?s ?p ?o .
}
limit 100

SPARQL の結果

「Raw Infobox Properties」および「ONtology Infobox Properties」データセットに関するDBpedia 3.8 ダウンロードページの内容に注意してください。

生のインフォボックスのプロパティ

ウィキペディアのインフォボックスから抽出された情報。このデータはあまりクリーンでない /property/ 名前空間にあることに注意してください。オントロジー インフォボックス プロパティ (/ontology/ 名前空間) は、常にこのデータよりも優先されるべきです。

オントロジーインフォボックスのプロパティ

オントロジーベースの抽出を使用してインフォボックスから抽出された高品質のデータ。このデータセットの述語は /ontology/ 名前空間にあります。以前のリリースでは、マッピング ベースのプロパティと呼ばれていました。

このデータは、/property/ 名前空間の未加工のインフォボックス プロパティよりもはるかに高品質であることに注意してください。たとえば、個人の生年月日には、Wikipedia の未加工のインフォボックス プロパティが 3 つあります。/ontology/ 名前空間では、それらはすべて1 つの関係http://dbpedia.org/ontology/birthDateにマッピングされ ます。これらの関係を統一できるのがDBpediaの強みです。

「Raw Infobox Properties」データ セットから奇妙なデータ値を取得しても、それほど驚くことではありません。代わりに「オントロジー Infobox プロパティ」を使用する必要があります。

于 2013-09-16T21:42:42.050 に答える