以前の回答は機能しなくなったようです。ただし、 http: //live.dbpedia.org/sparqlにある新しいdbpediaクエリエンドポイントで機能させるために必要な変更はわずかです。
このクエリを使用するすべてのページとテンプレートのリストを取得するには、次のようにします。
SELECT * WHERE { ?page dbpprop:wikiPageUsesTemplate ?template . }
結果を見る(100に制限)
特定のテンプレートを探している場合:
SELECT * WHERE {
?page
dbpprop:wikiPageUsesTemplate
<http://dbpedia.org/resource/Template:Infobox_website> .
}
結果を見る
また、私のユースケースでは、DBPediaページではなくWikipediaのURLに関心があるため、次のクエリを使用しています。
SELECT ?wikipedia_url WHERE {
?page
dbpprop:wikiPageUsesTemplate
<http://dbpedia.org/resource/Template:Infobox_website> .
?page foaf:isPrimaryTopicOf ?wikipedia_url .
}
結果を見る
curl
また、結果をスクリプトにプルするために使用しています。
$ curl -s "http://live.dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fdbpedia.org&query=SELECT+%3Fwikipedia_url+WHERE+%7B+%0D%0A%09+%3Fpage+%0D%0A%09+dbpprop%3AwikiPageUsesTemplate+%0D%0A%09+%3Chttp%3A%2F%2Fdbpedia.org%2Fresource%2FTemplate%3AInfobox_website%3E+.+%0D%0A+%3Fpage+foaf%3AisPrimaryTopicOf+%3Fwikipedia_url+.%0D%0A%0D%0A%09%7D&format=text%2Ftab-separated-values" \
| tr -d \" | grep -v "^wikipedia_url$" | head
http://en.wikipedia.org/wiki/U.S._News_&_World_Report
http://en.wikipedia.org/wiki/FriendFinder
http://en.wikipedia.org/wiki/Debkafile
http://en.wikipedia.org/wiki/GTPlanet
http://en.wikipedia.org/wiki/Lithuanian_Wikipedia
http://en.wikipedia.org/wiki/Connexions
http://en.wikipedia.org/wiki/Hypno5ive
http://en.wikipedia.org/wiki/Scoop_(website)
http://en.wikipedia.org/wiki/Bhoomi_(software)
http://en.wikipedia.org/wiki/Brainwashed_(website)
ただし、これで完全な結果セットが得られるかどうかはわかりません。1698の結果が返されるのに対し、wmflabs.orgは4439の結果が必要であると示唆しているようです。
質問の2番目の部分では、すべてのテンプレートのリストを取得するために、前のクエリからわずかな変更を加えるだけで済みます。
SELECT DISTINCT ?template WHERE {
?page
dbpprop:wikiPageUsesTemplate
?template .
FILTER (regex(?template, "Infobox")) .
} ORDER BY ?template
結果を見る