2

BBEdit で外国語の検索と置換を行う方法を研究してきましたが、問題が発生しています。調査の結果、正規表現に出くわしました-外国の文字に一致する正規表現は何ですか? これにより、Regular-Expressions.info にたどり着き、次のようなテキスト ブロックが表示されました。

Perl、PCRE、PHP、Ruby 2.0、および Just Great Software アプリケーションでは、単一のコード ポイントとしてエンコードされているか、結合マークを使用して複数のコード ポイントとしてエンコードされているかに関係なく、単一の書記素の照合は簡単です。\X を使用するだけです。

そして、単語がある場合(はい、これはテスト用に作成されています) 、単語全体ōallaōallaēēallaを使用することはできませんが[A-Za-z]*、代わりにセグメントで機能し、思いついた唯一の解決策は([A-Za-z]*\X{1,10}). あまりにも貪欲ではなく、単語全体を部分的に引っ張る代わりに引っ張る別のアプローチはありますか?

4

1 に答える 1

0

単語境界\bを使用して、境界間のすべてを一致させることができます。それですべてが得られるわけではありませんが、あなたの不自然な例ではうまくいきます。

/\b(.+)\b/

行頭にも単語が必要な場合は、それらを含める必要があります。

/(?:\b|^)(.+)\b/

regex101.com で試してみてください。ただし、これが BBEdit で機能するかどうかはテストできません。

于 2016-09-22T15:04:39.953 に答える