0

Twitter APIにクエリを実行しており、utf-8でエンコードされた回答を受け取ります。次に、これらの回答をformat()関数を使用して文字列に保存します。これは私がこれまでに持っているものです(そして私は多くの選択肢を試しました)。

for user in userInfos:
    tName = user["name"] if user["name"] is not None else ""
    tLocation = user["location"] if user["location"] is not None else ""
    tProfileImageUrl = user["profile_image_url"] if user["profile_image_url"] is not None else ""
    tCreatedAt = user["created_at"] 
    tFavouritesCount = user["favourites_count"] 
    tUrl = user["url"] if user["url"] is not None else ""
    tId = user["id"] 
    tProtected = user["protected"] 
    tFollowerCount = user["followers_count"]
    tLanguage = user["lang"]
    tVerified = user["verified"]
    tGeoEnabled = user["geo_enabled"]
    tTimeZone = user["time_zone"] if user["time_zone"] is not None else ""
    tFriendsCount = user["friends_count"]
    tStatusesCount = user["statuses_count"]
    tScreenName = user["screen_name"]

    # Custom characteristics
    age = utl.get_age_in_years(birthdayDict[str(tId)])

    # Follower-friend-ratio
    if tFriendsCount > 0:
        foRatio = float(tFollowerCount)/float(tFriendsCount)
    else:
        foRatio = ""

    # Age of account in weeks
    numWeeks = utl.get_age_in_weeks(tCreatedAt)

    # Tweets per time
    tweetsPerWeek = float(tStatusesCount) / numWeeks
    tweetsPerDay = tweetsPerWeek / 7.0

    in_users.remove(str(tId))

    outputList = [str(tName),
                  str(tScreenName),
                  str(tProfileImageUrl),
                  str(tLocation),
                  str(tCreatedAt),
                  str(tUrl),
                  str(age),
                  str(tStatusesCount),
                  str(tFollowerCount),
                  str(tFriendsCount),
                  str(tFavouritesCount),
                  str(foRatio),
                  str(tLanguage),
                  str(tVerified),
                  str(tGeoEnabled),
                  str(tTimeZone),
                  str(tProtected),
                  str(numWeeks),
                  str(tweetsPerWeek),
                  str(tweetsPerDay)]

    pprint.pprint(outputList)
    fOut.write("{}{}{}{}{}{}{}\n".format(twitterUsers[str(tId)], outputDelimiter, outputDelimiter.join(outputList), outputDelimiter, utl.get_date(), outputDelimiter, utl.get_time()))

str(tName)、str(tLocation)などは、tName/tLocationに\xe4などが含まれているとエラーが発生します

ERROR:__main__:'ascii' codec can't encode character u'\xe4' in position 10: ordinal not in range(128)
Traceback (most recent call last):
  File "../code/userinfo_extraction_old.py", line 167, in <module>
    outputList = [str(tName),
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe4' in position 10: ordinal not in range(128)

私はそれがどのように機能するかを理解しようとしましたが、ここで何が悪いのか理解できません。また、str()の代わりにunicode()を使用しようとしました...チャンスはありません。

4

1 に答える 1

1

unicodeデータをに変換strするには、エンコーディングを指定する必要があります。使用tName.encode('utf8')など。

PythonとUnicodeについて読みたいと思うかもしれません:

于 2013-02-08T12:02:15.403 に答える