JSON データをデコードせずにダウンロードしています。json
そのためにライブラリを使用します。
import json
articleContent = ClientCookie.urlopen(url)
data = json.load(articleContent)
JSON でエンコードされたデータは Python によく似ており、\u
エスケープも使用しますが、実際には JavaScript のサブセットです。
変数はdata
、深いデータ構造を保持するようになりました。弦の分割から判断すると、あなたはこの作品が欲しかった:
articleContent = data['query']['pages'].values()[0]['revisions'][0]['*']
articleContentは実際のunicode()
インスタンスです。これは、探していたページのリビジョン テキストです。
>>> print u'\n'.join(data['query']['pages'].values()[0]['revisions'][0]['*'].splitlines()[:20])
{{For|the game|100 Bullets (video game)}}
{{GOCEeffort}}
{{italic title}}
{{Supercbbox <!--Wikipedia:WikiProject Comics-->
| title =100 Bullets
| image =100Bullets vol1.jpg
| caption = Cover to ''100 Bullets'' vol. 1 "First Shot, Last Call". Cover art by Dave Johnson.
| schedule = Monthly
| format =
|complete=y
|Crime = y
| publisher = [[Vertigo (DC Comics)|Vertigo]]
| date = August [[1999 in comics|1999]] – April [[2009 in comics|2009]]
| issues = 100
| main_char_team = [[Agent Graves]] <br/> [[Mr. Shepherd]] <br/> The Minutemen <br/> [[List of characters in 100 Bullets#Dizzy Cordova (also known as "The Girl")|Dizzy Cordova]] <br/> [[List of characters in 100 Bullets#Loop Hughes (also known as "The Boy")|Loop Hughes]]
| writers = [[Brian Azzarello]]
| artists = [[Eduardo Risso]]<br>Dave Johnson
| pencillers =
| inkers =
| colorists = Grant Goleash<br>[[Patricia Mulvihill]]