任意の文字がスペースまたは句読点 (アポストロフィを除く) である文字列を分割したいと考えています。次の正規表現は意図したとおりに機能します。
/[^a-z']/i
I will や Did not などの単語が受け入れられます。これは素晴らしいことです。
問題は、「ere」や「im」などの単語です。先頭のアポストロフィを削除して、単語 im と ere を使用したいと思います。
可能であれば、正規表現パターン内でこれを停止/削除したいと考えています。
前もって感謝します。
これを試して
$str = "Words like I'll and Didn't are accepted, which is great.
The problem is with words like 'ere and 'im";
print_r(preg_split("/'?[^a-z']+'?/i", $str));
//Array ( [0] => Words [1] => like [2] => I'll [3] => and [4] => Didn't ...
// [16] => ere [17] => and [18] => im )