0

ウィキペディアの記事のコンテンツを xml / html / json またはさらには形式で抽出する方法は?

このメソッドは、BBCode の形式でデータを抽出し ます

私はそれらを参照するのが好きではないので、Javascript を使用してこのデータを使用することはできません。それを解析する方法は?データの使用に役立つ特別なライブラリがあるのではないでしょうか?

4

2 に答える 2

0

返されるデータはBBCodeではなく、 wikicode (MediaWiki 固有のマークアップ言語) です。

HTML に解析された結果を取得する場合は、クエリに追加&rvparseします。例: http://pl.wikipedia.org/w/api.php?format=json&action=query&titles=Wikipedia:Skarbnica%20Wikipedii/Wynalazki%20wieku%20XIX&prop=revisions&rvprop=content&rvparse

于 2013-10-31T12:28:30.893 に答える
0

次のコードをコピーして Chrome コンソールに貼り付け (F12 キーを押します)、コンソール ログ出力をクリックして、返されたオブジェクトを調べます。

(function(){
 var callbackName="cb";
 window[callbackName]=function(data){
   s.parentElement.removeChild(s);
   console.log(data);
   if(!data.query || !data.query.pages){
     //unexpected object, return
     return;
   }
   for(page in data.query.pages){
     console.log(data.query.pages[page]);
   }

 };
 var s = document.createElement("script");
 s.src="http://pl.wikipedia.org/w/api.php?"+
  "format=json&action=query&titles=Wikipedia:"+
  "Skarbnica%20Wikipedii/Wynalazki%20wieku%20"+
  "XIX&prop=revisions&rvprop=content&callback="+
  escape(callbackName);
 document.body.appendChild(s);
}());

ウィキペディアが他のデータを返すようにしたい場合は、その API をチェックしてください: http://en.wikipedia.org/w/api.php

于 2013-10-31T02:53:40.110 に答える