1

テキスト ファイル内のすべての特殊文字を XML 解析可能な特殊文字に変換するために、一連の正規表現置換 (つまり、String.replaceAll 呼び出し) を実行しています。例えば:

string_out = string_out.replaceAll("&", "&");

「セクション文字」、つまりこの小さな波線を置き換えることでつまずきにぶつかりました: §

まず、vi で編集を行っているため、そこに文字を貼り付けることさえできず、標準または拡張 ascii のメンバーではありません。同じ理由で、正規表現で16進コードで指定することもできません。

この文字を正規表現の代替としてどのように指定しますか? または、立ち寄って、私が手動で行っている文字変換を行う関数がどこかに隠れていることを教えてくれれば、それもクールです。

4

2 に答える 2

4
Unicode: §
Hex:     0xA7
html:    §
name:    section sign

latin-1 サプリメントで見つけることができます。

于 2010-08-19T17:43:40.033 に答える
0

ユニコードコードポイントを単純に使用できませんか?

于 2010-08-19T17:43:21.953 に答える