アルファベット、数字、特殊文字、ウムラウト文字などのすべての文字を許可する正規表現パターンが必要ですが、xml の生成を妨げる矢印記号のような無効な文字は許可しないという問題があります。これを手伝ってください。その無効な文字を空白に置き換えるにはどうすればよいですか?
私はJava 1.5を使用しています
アルファベット、数字、特殊文字、ウムラウト文字などのすべての文字を許可する正規表現パターンが必要ですが、xml の生成を妨げる矢印記号のような無効な文字は許可しないという問題があります。これを手伝ってください。その無効な文字を空白に置き換えるにはどうすればよいですか?
私はJava 1.5を使用しています
character class
a を使用して、すべての有効な文字に一致させることができます
^[a-zA-Z\d]+$
ただし、特定の文字を許可したくない場合は、使用できますNegated character class
^[^><]+$
--
|->your arrow signs go here...
たとえば、regex
like[^a-zA-Z]
は文字以外の任意の文字に一致します
replaceAll
関数は RegEx を取ります:
String myUnparsedString = "<some-xml-style-node>";
String myParsedString = myUnparsedString.replaceAll("<", " ");
おそらく、矢印のような不要な文字をすべて削除することができます:
String cleanXML = xml.replaceAll("[^\u0000-\u00ff]+", " ");
これは、範囲外の 1 つ以上の文字\x00-\xFF
をスペースに置き換えるだけです。