python - Python3 バイトオブジェクトのエンコーディングを見つける方法

Question

bytes.decode文字列とバイトを与えることは知っていstring.encodeますが、正しいものencodingが使用されている場合のみです。

次を使用してエンコードされたバイトオブジェクトがあるとgb18030
しbig5ます。

>>name = '深入 damon'
>>b1 = name.encode('gb18030')
>>> b1.decode('big5')
UnicodeDecodeError: 'big5' codec can't decode byte 0xc8 in position 2: illegal multibyte sequence

bytesオブジェクトからエンコーディングを見つける方法はありますか? ドキュメント
でこの点に関して有用な API を見つけることができませんでした。python3

score 7 · Accepted Answer

chardetパッケージを使用できます。このチュートリアルを読んでください。

Ubuntu を使用している場合:

sudo apt-get install python3-chardet

ピップを使用している場合:

pip install chardet2

python - Python3 バイト オブジェクトのエンコーディングを見つける方法

2 に答える 2

Related

Reference

python - Python3 バイトオブジェクトのエンコーディングを見つける方法