ウィキペディアの記事のコンテンツを xml / html / json またはさらには形式で抽出する方法は?
このメソッドは、BBCode の形式でデータを抽出し ます。
私はそれらを参照するのが好きではないので、Javascript を使用してこのデータを使用することはできません。それを解析する方法は?データの使用に役立つ特別なライブラリがあるのではないでしょうか?
ウィキペディアの記事のコンテンツを xml / html / json またはさらには形式で抽出する方法は?
このメソッドは、BBCode の形式でデータを抽出し ます。
私はそれらを参照するのが好きではないので、Javascript を使用してこのデータを使用することはできません。それを解析する方法は?データの使用に役立つ特別なライブラリがあるのではないでしょうか?
返されるデータはBBCodeではなく、 wikicode (MediaWiki 固有のマークアップ言語) です。
HTML に解析された結果を取得する場合は、クエリに追加&rvparseします。例: http://pl.wikipedia.org/w/api.php?format=json&action=query&titles=Wikipedia:Skarbnica%20Wikipedii/Wynalazki%20wieku%20XIX&prop=revisions&rvprop=content&rvparse
次のコードをコピーして Chrome コンソールに貼り付け (F12 キーを押します)、コンソール ログ出力をクリックして、返されたオブジェクトを調べます。
(function(){
 var callbackName="cb";
 window[callbackName]=function(data){
   s.parentElement.removeChild(s);
   console.log(data);
   if(!data.query || !data.query.pages){
     //unexpected object, return
     return;
   }
   for(page in data.query.pages){
     console.log(data.query.pages[page]);
   }
 };
 var s = document.createElement("script");
 s.src="http://pl.wikipedia.org/w/api.php?"+
  "format=json&action=query&titles=Wikipedia:"+
  "Skarbnica%20Wikipedii/Wynalazki%20wieku%20"+
  "XIX&prop=revisions&rvprop=content&callback="+
  escape(callbackName);
 document.body.appendChild(s);
}());
ウィキペディアが他のデータを返すようにしたい場合は、その API をチェックしてください: http://en.wikipedia.org/w/api.php