次のような utf-8 テキストが必要です。
「Bára, ta která má hezké oči. To je, ale nepříčetně nehorázné!」
次のように、単語と句読点の配列に分割します。
Array (
[0] => Bára
[1] => ,
[2] => ta
[3] => která
[4] => má
[5] => hezké
[6] => oči
[7] => .
[8] => To
[9] => je
[10] => ,
[11] => ale
...
)
ここでいくつかの例を試しましたが、どちらも utf8 テキスト (á または ě の分割テキスト) では機能しませんでした。