5

UTF-8 の字幕ファイルがいくつかあります。これらのファイルには、一部のアプリケーションで問題を引き起こす散発的なマルチバイト文字が含まれていることがあります。

特定のファイルにマルチバイト文字が含まれているかどうかを Linux でチェックする (およびこれらを見つける可能性がある) 方法を教えてください。

4

2 に答える 2

3

ファイルコマンドを使用できます

chalet16$ echo test > a.txt
chalet16$ echo testก >  b.txt #One of Thai characters
chalet16$ file *.txt
a.txt: ASCII text
b.txt: UTF-8 Unicode text
于 2012-04-29T15:18:09.340 に答える
2

fileまたはchardetコマンドを使用できます。

于 2012-04-29T15:16:13.630 に答える