ファイルに多くの単語 [MM] があります。
このコマンドを実行しました:
cat file.txt | tr " " "\n"| sort | uniq > uniq.out
多くの中国語の単語といくつかの英数字と特殊文字があることがわかりました
英語の [AZ][az] のみのすべての単語を取得したい
grep -E "[A-Za-z]" uniq.out | grep -Ev "[0-9]" | less
上記のコマンドは、英数字の単語にも一致します。
助言がありますか ?
ありがとう!