ウィキペディアの記事のコンテンツを xml / html / json またはさらには形式で抽出する方法は?
このメソッドは、BBCode の形式でデータを抽出し ます。
私はそれらを参照するのが好きではないので、Javascript を使用してこのデータを使用することはできません。それを解析する方法は?データの使用に役立つ特別なライブラリがあるのではないでしょうか?
ウィキペディアの記事のコンテンツを xml / html / json またはさらには形式で抽出する方法は?
このメソッドは、BBCode の形式でデータを抽出し ます。
私はそれらを参照するのが好きではないので、Javascript を使用してこのデータを使用することはできません。それを解析する方法は?データの使用に役立つ特別なライブラリがあるのではないでしょうか?
返されるデータはBBCodeではなく、 wikicode (MediaWiki 固有のマークアップ言語) です。
HTML に解析された結果を取得する場合は、クエリに追加&rvparse
します。例: http://pl.wikipedia.org/w/api.php?format=json&action=query&titles=Wikipedia:Skarbnica%20Wikipedii/Wynalazki%20wieku%20XIX&prop=revisions&rvprop=content&rvparse
次のコードをコピーして Chrome コンソールに貼り付け (F12 キーを押します)、コンソール ログ出力をクリックして、返されたオブジェクトを調べます。
(function(){
var callbackName="cb";
window[callbackName]=function(data){
s.parentElement.removeChild(s);
console.log(data);
if(!data.query || !data.query.pages){
//unexpected object, return
return;
}
for(page in data.query.pages){
console.log(data.query.pages[page]);
}
};
var s = document.createElement("script");
s.src="http://pl.wikipedia.org/w/api.php?"+
"format=json&action=query&titles=Wikipedia:"+
"Skarbnica%20Wikipedii/Wynalazki%20wieku%20"+
"XIX&prop=revisions&rvprop=content&callback="+
escape(callbackName);
document.body.appendChild(s);
}());
ウィキペディアが他のデータを返すようにしたい場合は、その API をチェックしてください: http://en.wikipedia.org/w/api.php