HTMLからいくつかの名前を抽出しようとしています。たとえば、文字列は次のようになります。
Doe, J
私が使用しているパターンは次のとおりです。
\w+, \w
名前が英語のアルファベットの文字で構成されている限り、すべて正常に機能します。同じパターンは、スペイン語またはポーランド語の名前には一致しません。
Cortázar, J
Król, S
明らかに特定のキャラクターが問題です。\w をこれらの文字と一致させるために何をすべきか考えていますか? NSRegularExpression optionsを調べましたが、サポートしているとは思いません。それとも、ここで要点を見逃しているので、よりスマートな正規表現を考え出す必要がありますか?