関連するアイテムを含むある種のデータセットが必要です。たとえば、 aflower
には関連するサブタイプがあります: roses
、violets
など。これらの各サブタイプには独自のサブタイプがあります。これは、セマンティック検索エンジンなどで使用される関連アイテムのグラフである可能性があります。
そのようなデータセット(できれば画像付き)がある場所はありますか?
関連するアイテムを含むある種のデータセットが必要です。たとえば、 aflower
には関連するサブタイプがあります: roses
、violets
など。これらの各サブタイプには独自のサブタイプがあります。これは、セマンティック検索エンジンなどで使用される関連アイテムのグラフである可能性があります。
そのようなデータセット(できれば画像付き)がある場所はありますか?
DBPediaは、前述の Sagie の Wikipedia を拡張したもので、Wikipedia から構造化データをデータ セットに抽出したプロジェクトです。彼らは、データセットには 377 万の「もの」と 4 億の事実があると述べました。さまざまな言語でローカライズされた情報もあります。
完全な DBpedia データ セットには、最大 111 の異なる言語で 1,030 万の固有のもののラベルと要約が含まれています。画像への 800 万のリンクと、外部 Web ページへの 2,440 万の HTML リンク。外部 RDF データ セットへの 2,720 万のデータ リンク、Wikipedia カテゴリへの 5,580 万のリンク、および 820 万の YAGO カテゴリへのリンク。このデータセットは 18 億 9000 万の情報 (RDF トリプル) で構成されており、そのうち 4 億はウィキペディアの英語版から、14 億 6000 万は他の言語版から抽出され、約 2700 万は外部 RDF データ セットへのデータ リンクです。
彼らのデータセットは、SPARQL を介してクエリ可能です。彼らが与える例は、人口が200万人を超える上位20都市です。
SELECT ?subject ?population WHERE {
?subject rdf:type <http://dbpedia.org/ontology/City>.
?subject <http://dbpedia.org/ontology/populationUrban> ?population.
FILTER (xsd:integer(?population) > 2000000)
}
ORDER BY DESC(xsd:integer(?population))
LIMIT 20