10

本「マイニング・ザ・ソーシャル・ウェブ」のサンプルコード、1-3をたどってみました。

私はそれが古いことを知っているので、Web ページから新しいサンプルをたどりますここにリンクの説明を入力してください

しかし、コードを実装すると、エラー情報が表示されることがあります。

[ trend.decode('utf-8') for trend in world_trends()[0]['trends'] ]

エラー情報は次のようになります。

Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "build/bdist.macosx-10.6-universal/egg/twitter/api.py", line 167, in __call__
File "build/bdist.macosx-10.6-universal/egg/twitter/api.py", line 173, in _handle_response
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode byte 0x8b in position 1: unexpected code byte

常に発生するとは限りませんが、このような「ランダムな」ケースを好むプログラマーはいないと思います。

それで、誰かがこの問題について私を助けることができますか? 問題は何ですか、どうすればこれを解決できますか?

ありがとうございます~

4

2 に答える 2

24

byte 0x8b in position 1通常、データ ストリームが gzip されていることを示します。同様の問題については、こちらこちらを参照してください。

データ ストリームを解凍するには:

buf = StringIO.StringIO(<response object>.content)
gzip_f = gzip.GzipFile(fileobj=buf)
content = gzip_f.read()
于 2014-12-13T14:44:46.323 に答える
1

デフォルトでは、デコード方法がわからないバイトに遭遇すると、decode() はエラーをスローします。

trend.decode('utf-8', 'replace')orを使用trend.decode('utf-8', 'ignore')してエラーをスローせず、黙って無視することができます。

decode() に関するドキュメントはこちら。

于 2012-08-15T17:15:13.450 に答える