中国語の文字列の例を次に示します。
"最初 , 上帝 创造 了 天地 。 2 大地 混沌 苍茫 , 深渊 的 表面 一 片 黑暗 。 "
これを次のような配列に分割するにはどうすればよいですか?:
Array
(
[0] => 最初 , 上帝 创造 了 天地 。 2 大地 混沌 苍茫 , 深渊 的 表面 一 片 黑暗 。
[1] => 2 大地 混沌 苍茫 , 深渊 的 表面 一 片 黑暗 。
)
私は試しましたが失敗しました:
$array = mb_split('。', $string);
echo "<pre>";
print_r($array);
私はこれを手に入れます:
Array
(
[0] => 最初 , 上帝 创造 了 天地 。 2 大地 混沌 苍茫 , 深渊 的 表面 一 片 黑暗 。
)
ps文字セットはGB18030です。
私はより多くの情報を見つけました。中国の期間は終止符と呼ばれます。htmlエスケープはと。
です。
。GB18030の16進バイトはa1a3です。Unicode文字は「表意文字の終止符」(U + 3002)です。これらのいずれかを使用して目標を達成するにはどうすればよいですか?