3

後で解析に使用される特定の場所で区切り記号を使用してテキストにタグを付けようとしています。使用頻度の低い区切り文字を使いたい。現在、「\2」または U+0002 文字を見ています。それは使用するのに十分安全ですか?他にどんな提案がありますか?テキストはユニコードで、英語と英語以外の文字の両方が含まれます。

PHP で「exploded()」できる文字を使いたい。

編集:

また、このテキストを画面に (ブラウザーに) 表示できるようにしたいと考えています。区切り文字はユーザーには「見えません」。確かに、str_replace() を使用して可視の区切り記号を取り除くことができますが、適切な不可視の区切り記号があれば、そのような処理は必要ありません。

4

1 に答える 1

4

これが内部表現のみの場合 (つまり、交換および保存用ではない)、U+FFFF などの非文字コード ポイントを使用できます。Java はそれを CharacterIterator が完了したことを示すシグナルとして使用します

于 2011-06-27T13:57:08.643 に答える