Pythonでファイルのタイプを推測する方法またはパッケージはありますか? たとえば、ファイルがASCII、Unicode、またはバイナリとして開かれている可能性があることを検出する方法はありますか?
前もって感謝します!
filemagic モジュールが必要です。
Unix OS (Linux または Mac) を使用している場合は、magic
. Mac の場合は、brew install libmagic
. Python スクリプトに組み込むためのfilemagicという Python ライブラリがあります。
import magic
mage = magic.Magic()
mage.id_buffer("adsfadsf←")
最後の行は、「UTF-8 Unicode テキスト、行末記号なし」を返します。
ファイル名ではなく、ファイルの先頭にあるマジック バイトに基づいてファイルをチェックすることもできます。