yajl-py で GitHub アーカイブ ファイルを解析しようとしています。ファイルの基本的な形式は JSON オブジェクトのストリームであると考えているため、ファイル自体は有効な JSON ではありませんが、有効なオブジェクトが含まれています。
yajl-py
これをテストするために、サンプル パーサー ( https://github.com/pykler/yajl-py/blob/master/examples/yajl_py_example.pyから)をインストールして使用し、ファイルの解析を試みました。
python yajl_py_example.py < 2012-03-12-0.json
は2012-03-12-0.json
、解凍された GitHub アーカイブ ファイルの 1 つです。
この種のことは、Ruby での参照実装から機能するはずです。Python パッケージは JSON ストリームを処理しませんか?
ちなみに、ここに私が得るエラーがあります:
yajl.yajl_common.YajlError: parse error: trailing garbage
9478bbc3","type":"PushEvent"}{"repository":{"url":"https://g
(right here) ------^