2

私の目標は、データをdef on_status(self, status):json形式で取得することです。現在、JSON に似た形式でデータを返しますが、JSON ではありません。

{'favorited': False, 'contributors': None, 'truncated': False, 'text': 'Lol. As long as you and Tsidi are awake, am not sleeping RT @TboyMP: @Fufu_Tinkies hambo lala wena!! LMAO!!', 'source_url': 'http://ubersocial.com', 'in_reply_to_status_id': None, 'user': <tweepy.models.User object at 0x1b4f3d0>, 'filter_level': 'medium', 'geo': None, 'id': 326808604013379586, 'favorite_count': 0, 'source': 'UberSocial for BlackBerry', 'lang': 'en', 'author': <tweepy.models.User object at 0x1b4f3d0>, 'created_at': datetime.datetime(2013, 4, 23, 21, 23, 37), 'retweeted': False, 'coordinates': None, 'in_reply_to_user_id_str': None, 'entities': {'symbols': [], 'user_mentions': [{'id': 282499717, 'indices': [60, 67], 'id_str': '282499717', 'screen_name': 'TboyMP', 'name': 'Thulane Khanye'}, {'id': 157961325, 'indices': [69, 82], 'id_str': '157961325', 'screen_name': 'Fufu_Tinkies', 'name': 'Nomfundo'}], 'hashtags': [], 'urls': []}, 'in_reply_to_status_id_str': None, 'in_reply_to_screen_name': None, 'id_str': '326808604013379586', 'place': None, 'retweet_count': 0, 'in_reply_to_user_id': None}

ご覧のとおり、二重引用符ではなく単一引用符を使用しています。これを取得する方法は次のとおりです。

data = status.__getstate__()

ただしload、jsonモジュールではできません:エラーが発生します:

Encountered Exception: expected string or buffer

では、JSON でそこからデータを削除する方法、または JSON に変換する方法は?

アップデート

私はこのようなものが欲しい:

>>> data = '[{"fooo":"bar","something":"another bar"}]'
>>> ww = json.loads(data)
>>> ww[0]['fooo']
u'bar'

データを使ってこれを行うことができる方法で助けを得ることを期待していtweepyます....ありがとう。

4

2 に答える 2

4

これにより、生のjsonデータがdef on_status(self, status):ファイルに書き込まれます。

このソリューションは、未加工の json データをステータス オブジェクトに追加するためにここから取得され、ここでは tweepy のストリーミング機能を使用するためのスケルトン コードとして取得されました。

@classmethod                    
def parse(cls, api, raw):
        status = cls.first_parse(api, raw)
        setattr(status, 'json', json.dumps(raw))
        return status

tweepy.models.Status.first_parse = tweepy.models.Status.parse
tweepy.models.Status.parse = parse

_dir = os.path.dirname(os.path.abspath(__file__))

class CustomStreamListener(tweepy.StreamListener):
    def on_status(self, status):
        print status.user.screen_name
        with codecs.open(os.path.join(_dir, 'tweets.json'), "a", 'utf-8') as textFile:
                textFile.write(status.json)
                textFile.write('\n')

    def on_error(self, status_code):
        print >> sys.stderr, 'Encountered error with status code:', status_code
        return True # Don't kill the stream

    def on_timeout(self):
        print >> sys.stderr, 'Timeout...'
        return True # Don't kill the stream

私は Python の専門家ではありませんが、解析メソッドが新しいバージョンでホット パッチされ、その新しいバージョンが tweepy クラス階層にインストールされているようです。新しいバージョンは古いバージョンを呼び出し、元の parse メソッドから返されたオブジェクトに json スロットを追加します。

于 2013-07-30T19:49:31.063 に答える
1

あなたが持っているのは Python 辞書です。それを JSON に変換するには、次のようにしますjson.dumps()

import json
json_data = json.dumps(data)
于 2013-04-23T21:35:56.393 に答える