sed コマンドでドット/アスタリスクが utf8 文字と一致しない理由を理解したいと思います。
$ echo "begin remove � end" | sed 's/remove.*//' 始まり・終わり
(期待される結果は である必要がありますbegin
)
�文字(U+00E0 à)が3バイトで表現されているからでしょうか。
sed コマンドでドット/アスタリスクが utf8 文字と一致しない理由を理解したいと思います。
$ echo "begin remove � end" | sed 's/remove.*//' 始まり・終わり
(期待される結果は である必要がありますbegin
)
�文字(U+00E0 à)が3バイトで表現されているからでしょうか。