2

逆ジオコーディングを行うためにgooglemaps Python パッケージを使用しています。観察:

PS Z:\dev\poc\SDR> python
Python 2.7.1 (r271:86832, Nov 27 2010, 17:19:03) [MSC v.1500 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from googlemaps import GoogleMaps
>>> gmaps = GoogleMaps("*** my google API key ***")
>>> d=gmaps.reverse_geocode(51.75,19.46667)
>>> d
{u'Status': {u'code': 200, u'request': u'geocode'}, u'Placemark': [{u'Point': {u'coordinates': [19.466876, 51.7501456, 0]}, u'ExtendedData': {u'LatLonBox': {u'west': 19.465527, u'east': 19.468225, u'n
orth': 51.7514946, u'south': 51.7487966}}, u'AddressDetails': {u'Country': {u'CountryName': u'Polska', u'AdministrativeArea': {u'SubAdministrativeArea': {u'SubAdministrativeAreaName': u'\u0141\xf3d\u0
17a', u'Locality': {u'Thoroughfare': {u'ThoroughfareName': u'ksi\u0119dza Biskupa Wincentego Tymienieckiego 16'}, u'LocalityName': u'\u0141\xf3d\u017a'}}, u'AdministrativeAreaName': u'\u0142\xf3dzkie'
}, u'CountryNameCode': u'PL'}, u'Accuracy': 8}, u'id': u'p1', u'address': u'ksi\u0119dza Biskupa Wincentego Tymienieckiego 16, 90-001 \u0141\xf3d\u017a, Poland'}], u'name': u'51.750000,19.466670'}
>>> import pprint
>>> pp = pprint.PrettyPrinter(indent = 2)
>>> pp.pprint(d)
{ u'Placemark': [ { u'AddressDetails': { u'Accuracy': 8,
                                         u'Country': { u'AdministrativeArea': { u'AdministrativeAreaName': u'\u0142\xf3dzkie',
                                                                                u'SubAdministrativeArea': { u'Locality': { u'LocalityName': u'\u0141\xf3d\u017a',
                                                                                                                           u'Thoroughfare': { u'ThoroughfareName': u'ksi\u0119dza Biskupa Wincentego Tym
ienieckiego 16'}},
                                                                                                            u'SubAdministrativeAreaName': u'\u0141\xf3d\u017a'}},
                                                       u'CountryName': u'Polska',
                                                       u'CountryNameCode': u'PL'}},
                    u'ExtendedData': { u'LatLonBox': { u'east': 19.468225,
                                                       u'north': 51.7514946,
                                                       u'south': 51.7487966,
                                                       u'west': 19.465527}},
                    u'Point': { u'coordinates': [19.466876, 51.7501456, 0]},
                    u'address': u'ksi\u0119dza Biskupa Wincentego Tymienieckiego 16, 90-001 \u0141\xf3d\u017a, Poland',
                    u'id': u'p1'}],
  u'Status': { u'code': 200, u'request': u'geocode'},
  u'name': u'51.750000,19.466670'}

さて、辞書をファイルに保存したいのですが、地域名としてd見たくありません。u'\u0141\xf3d\u017a'見たいですŁódź。それはそう:

だから、私はこれを試しました:

with codecs.open("aa.txt", "w", "utf-8") as f:
  f.write(unicode(d))

この:

with codecs.open("aa.txt", "w", "utf-8") as f:
  f.write(unicode(str(d), "utf-8"))

この:

with open("aa.txt", "w") as f:
  f.write(unicode(d))

そしてもちろん、何も機能しません。すべての試行で が得られ\u0141\xf3d\u017aます。どうすれば正しく保存できますか?

4

3 に答える 3

3

に渡しensure_ascii=Falsejson.dump*()使用しますcodecs.open()

于 2012-04-19T15:36:08.483 に答える
3

最初の形式は、Unicode をファイルに書き込むのに適しています。

>>> s = u'\u0141\xf3d\u017a'
>>> with codecs.open('aa.txt', 'w', 'utf-8') as f:
...     f.write(s)
... 
>>> with codecs.open('aa.txt', 'r', 'utf-8') as f:
...     print f.read()
... 
Łódź

何が起こっているかというと、unicode(d) を使用するときに辞書の表現を保存しているということです。

>>> unicode(d)
u"{u'locality': u'\\u0141\\xf3d\\u017a'}"

これは次と同等です:

>>> unicode(repr(d))
u"{u'locality': u'\\u0141\\xf3d\\u017a'}"

したがって、あなたは実際に Łódź をファイルに書き留めているわけではありません。元のエスケープ シーケンスがエスケープされていることに注意してください。u'\u0141' は Ł 文字ですが、u'\u0141' は 6 文字の文字列です。

Python 辞書には、そのようなエスケープを行わない Unicode 表現がないため、より適切なシリアル化方法を使用する必要があります。ファイルを読み取るアプリケーションがサポートしている場合は、json を使用しても問題ありません。

同じシリアル化方法をサポートしていない他のアプリケーションで読み取り可能なファイルに本当に書き留める必要がある場合は、辞書を反復処理し、表現ではなく、キーと値のペアを一度に 1 つずつ書き留める必要があります。

于 2012-04-19T15:59:25.883 に答える
1

ファイルはバイトのストリームであるため、ファイルに保存する前に Unicode をエンコード (バイトとして表す) する必要があります。ここで、開くとき (ファイルからデータを読み取るとき) に、utf-8 などの同じデコード (エンコード) スキームを使用して、データを Unicode にデコードする必要があります。

オブジェクトの表現ではなく、ファイル内にオブジェクトのシリアル化を書き込むように注意してください。json.dumps(d) を使用してシリアル化を取得し、 json.loads(filecontent) を使用してそれを読み戻します

于 2012-04-19T15:36:24.087 に答える