.json.gz
いくつかのファイルを解凍しようとしていますがgzip
、いくつかの文字が追加されているため、JSON で読み取ることができません。
何が問題だと思いますか、どうすれば解決できますか?
7zip などの解凍ソフトウェアを使用してファイルを解凍すると、この問題はなくなります。
これは私のコードです:
with gzip.open('filename' , 'rb') as f:
json_content = json.loads(f.read())
これは私が得るエラーです:
Exception has occurred: json.decoder.JSONDecodeError
Extra data: line 2 column 1 (char 1585)
私はこのコードを使用しました:
with gzip.open ('filename', mode='rb') as f:
print(f.read())
そして、ファイルが次で始まることに気付きましたb'
(以下に示すように):
b'{"id":"tag:search.twitter.com,2005:5667817","objectType":"activity"
b'
次の段階でファイルが機能しなくなる原因だと思います。を削除する解決策はありb'
ますか? この zip ファイルは何百万もありますが、手動で行うことはできません。
これらのファイルのサンプルを次のリンクにアップロードしました json.gz ファイルのほんの一部です