0

次のようなデータを含む多くのテキスト ファイルがあります。

{'photo': {'people': {'haspeople': 0}, 'dateuploaded': '1264588417', 'originalformat': 'jpg', 'tags': {'tag': [{'machine_tag': 0 , '著者': '14988396@N00', 'テキスト': 'bokehlicious', 'raw': 'Bokehlicious', 'authorname': 'chachahavana', 'id': '1921934-4308203423-4944107'}],[ {'machine_tag': 0, 'author': '14988396@N00', 'text': 'bokehlicious2', 'raw': 'Bokehlicious2', 'authorname': 'chachahavana', 'id': '1921934-4308203423- 4944107'}]、'stat': 'OK'}

これはjson形式であるはずでしたが、問題があり、このように保存されました。

ここで、これらのファイルから特定の文字列を抽出したいと考えています。たとえば、このファイルの cell 配列としてテキスト bokehlicious、bokehlicious2 などを指定します。

textscan を使ってみたのですが、これには適切なフォーマットなどがないので、テキストファイル内のすべての「テキスト」の後にすべての文字列を抽出する方法を知りたいです。

これを行う方法について何か意見をいただけますか?ありがとう

4

1 に答える 1