MacOS bash シェルで大きなファイルから英語以外の文字を抽出しようとすると、「不正なバイト シーケンス」エラーが発生します。これは私が使用しようとしているスクリプトです:
sed 's/[][a-z,0-9,A-Z,!@#\$%^&*(){}":/_-|. -][\;''=?]*//g' < $1 >Abhineet_extract1.txt;
sed 's/\(.\)/\1\
/g' <Abhineet_extract1.txt | sort | uniq |tr -d '\n' >&1;
rm Abhineet_extract1.txt;
ここに私が得ているエラーがあります:
uniq: stdin: Illegal byte sequence
+?