ファイルからすべてのマルチバイト文字を削除する必要があります。それらが何であるかわからないため、範囲全体をカバーする必要があります。
次のようにgrepを使用してそれらを見つけることができます:grep -P "[\ x80- \ xFF]"'myfile'
sedで同じようなことをしようとしていますが、代わりにそれらを削除してください。
乾杯
これを試してみてください:
LANG=C sed 's/[\x80-\xFF]//g' filename
iconvを使用して、あるエンコーディングから別のエンコーディングに変換できます