1

HTMLからいくつかの名前を抽出しようとしています。たとえば、文字列は次のようになります。

Doe, J

私が使用しているパターンは次のとおりです。

\w+, \w

名前が英語のアルファベットの文字で構成されている限り、すべて正常に機能します。同じパターンは、スペイン語またはポーランド語の名前には一致しません。

Cortázar, J
Król, S

明らかに特定のキャラクターが問題です。\w をこれらの文字と一致させるために何をすべきか考えていますか? NSRegularExpression optionsを調べましたが、サポートしているとは思いません。それとも、ここで要点を見逃しているので、よりスマートな正規表現を考え出す必要がありますか?

4

2 に答える 2

0

NSRegularExpressionUnicode 文字とうまく一致していないようですが、代わりに区切り文字まですべてを一致させることができます。

^(\X+?),$

これにより、必要な結果を持つキャプチャ グループが作成され、ユニコードにも一致するはずです。

一致する文字式\uまたはを使用することもできます\pこれはここで見ることができます。この記事では、それらについて説明します。

于 2013-11-04T16:40:28.680 に答える