2

ウィキペディアのトピックの内容を取得するための簡単な Python アプリケーションを自分で作成しようとしています。たとえば、例として、フルーツappleのページのコンテンツを取得しようとしています。これは私のクエリです:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=apple

出力 (フォーマット済み) は次のようになります。

http://pastebin.com/LNdDjXFj

しかし、これは実際には XML のようには見えません。それは(私が思うに)phpに似ています。これをPythonで解析しようとするだけですか、それとももっと良い方法がありますか?

4

1 に答える 1

0

これは PHP ではなく、メディア wiki のフォーマットです。

フォーマット mw ページを見てください: http://www.mediawiki.org/wiki/API:Parsing_wikitext

個人的には、json 形式のバージョンの方が見栄えがします (一度解析すると)。

于 2012-05-23T21:57:56.087 に答える