既存のウィキペディアAPIを使用して、ジオロケーションに関する記事のリストを取得することは可能ですか?グーグルマップのように?
私は「ここ」にいると言い、ウィキペディアで私の周りに何があるかを調べたいと思います。
このような記事では、右側に「座標」が表示されているので、これらの座標についてクエリを実行したいと思います...
何かご意見は?
既存のウィキペディアAPIを使用して、ジオロケーションに関する記事のリストを取得することは可能ですか?グーグルマップのように?
私は「ここ」にいると言い、ウィキペディアで私の周りに何があるかを調べたいと思います。
このような記事では、右側に「座標」が表示されているので、これらの座標についてクエリを実行したいと思います...
何かご意見は?
車輪を再発明するのではなく、DBpediaを使用してください。
「緯度」と「経度」のデータが抽出されたサンプルページ。そして、それはSPARQL
でクエリできます。
Wikilocationを見てください。役に立つかもしれません。
ソリューション jquery および geonames API:
a,b = 経度、緯度、つぶやき -> html div
function getcontent(a,b) {
jQuery(function($) {
$.getJSON('http://api.geonames.org/findNearbyWikipediaJSON?formatted=true&lat='+ a +'&lng='+ b +'&username=username&style=full&lang=de&wikipediaUrl&thumbnailImg', function(json) {
for(var i = 0; i < json.geonames.length; i++) {
$("#tweet").prepend('<span style="font-family: geneva, arial, helvetica, sans-serif;"><br><br><img src="wikilogo.gif"><br>' + json.geonames[i].summary + '<br><a href="http://'+ json.geonames[i].wikipediaUrl +'" target="_blank">'+ json.geonames[i].wikipediaUrl +'</a><br></span>');
}
});
});
}
このためのウィキペディア API はないようですが、このウィキペディアのページでは、他のユーザーがこの情報をどのように利用しているかを説明しています。
すべての座標は、ウィキペディア データベース ダンプでダウンロードできます。すべての記事の XML 形式のダンプ (enwiki-latest-pages-articles.xml.bz2、4 GB) から座標を取得するには、上記のエントリ形式の座標を含むページのダンプを解析する必要があります。ウィキペディアのほとんどの記事はこれらの形式に準拠しており、座標は単純な文字シーケンスの正規表現を使用してウィキテキストから簡単に解析できます。すべての座標は同じ PHP ツールにリンクしているため、外部リンクの SQL フォーマット テーブル (enwiki-latest-externallinks.sql.gz、725MB) からも見つけることができます。ただし、この 2 番目の方法には、記事の本文とタイトル領域の間の位置など、座標に関するすべての利用可能な情報が含まれているわけではありません。
DBpedia と SPARQL は、少なくともドイツ語のウィキペディアには適していません。対象範囲が狭すぎます。
私は今、(ダンプから) さまざまな地理座標形式をすべて自分で解析しようとしていますが、実際にはさまざまなバリエーションがたくさんあるため、それは非常に困難です。