マルチバイト文字を自分自身に置き換える正規表現のようなものはありますか?
つまり、次のような文字を含む大きなテキストファイルがあります。
漁魚京供侠競共
そしてそれらを次のように置き換えたい:
漁;
魚;
京;
供;
...
正規表現を使用してこれを行うにはどうすればよいですか? 私はすでに試しました:
(.)
と置換する
\1;\n
しかし、それはマルチバイト文字(つまり、utf8)を1行あたり1バイトに「分割」します(したがって、1文字は2行以上に分割されます)。半角文字の場合は正常に機能します...どんな助けでも大歓迎です。