私は、分音記号付きの Unicode 文字をプレーンな ASCII 文字に変換する Google スプレッドシートの数式を作成しようとしています。
Google が「REGEXREPLACE」関数でRE2 を使用していることがわかります。そして、RE2 が Unicode 文字クラスを提供していることがわかります。
私は式を書き込もうとしました(これに似ています):
REGEXREPLACE("público","(\pL)\pM*","$1")
ただし、スプレッドシートでは次のエラーが発生します。
関数 REGEXREPLACE パラメータ 2 の値 "\pL" は有効な正規表現ではありません。
入れ子になった SUBSTITUTE 関数 ( Like this one ) の長いセットで構成される数式を記述できると思いますが、それはかなりひどいようです。
Google スプレッドシートの数式でダイアクリティカル/アクセント記号を使用して Unicode 文字を正規化するためのより良い方法を提案できますか?