ユーロ記号を含む特定の正規表現クラスはありますか?grepマニュアルによると、[:print:]クラス(AFAIK€は印刷可能)と[:punct:]クラスには、ロケール(en_US.UTF-8)とASCII句読文字( $を含む)
$ echo "I can has 5€ ?" | grep -o "[[:print:]*"
I can has 5
すべての印刷可能な文字をキャッチできる別の解決策はありますか(この問題はドル以外のすべての通貨文字で発生すると思います)?
編集 パテ設定で遊んだ後、ファイルを印刷するときに€を表示することができましたが、それをgrepすると奇妙に動作します。最初は、パテエンコーディングを(Unicodeではなく)cp1252に変更した後、「€」bbutを印刷することさえできませんでしたが、記号が表示されます。greppingはまだ機能しません
$ cat test.bah
I can has 5€ ?
$ cat test.bah | grep -o '[[:print:]]*'
I can has 5
?
$ locale
LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
...