Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
UTF-8 の字幕ファイルがいくつかあります。これらのファイルには、一部のアプリケーションで問題を引き起こす散発的なマルチバイト文字が含まれていることがあります。
特定のファイルにマルチバイト文字が含まれているかどうかを Linux でチェックする (およびこれらを見つける可能性がある) 方法を教えてください。
ファイルコマンドを使用できます
chalet16$ echo test > a.txt chalet16$ echo testก > b.txt #One of Thai characters chalet16$ file *.txt a.txt: ASCII text b.txt: UTF-8 Unicode text
fileまたはchardetコマンドを使用できます。
file
chardet