Pythonの場合:
u'\u3053\n'
utf-16ですか?
私はすべてのUnicode/エンコーディングのことを本当に知っているわけではありませんが、私が持っているかのように、このタイプのものが私のデータセットに現れていa=u'\u3053\n'
ます。
print
例外を与え、デコードは例外を与えます。
a.encode("utf-16") > '\xff\xfeS0\n\x00'
a.encode("utf-8") > '\xe3\x81\x93\n'
print a.encode("utf-8") > πüô
print a.encode("utf-16") > ■S0
何が起きてる?