Java 文字列から XML タグを削除しようとしています。私の見方では、次のいずれかまたは両方の形式に従うものは XML タグです。
<*>*<*/*>
など<fizz>buzz< /fizz>
。また<*/*>
、 そのような< fizz />
私の正規表現は単純です:
String tagful = "Hello <fizz>buzz</fizz>Regexes!";
String tagless = tagful.replaceAll("<*>*<*/*>", "");
tagless = tagless.replaceAll("<*/*>", "");
System.err.println("TAGLESS:\n\t" + tagless);
これを実行するHello <fizzbuzz</fizzRegexes!
と、出力として取得されますが、(XML ストリッピング コードが正しかった場合) が取得されるはずHello Regexes!
です。私はどこで迷うのですか?
注意:既存のライブラリを使用したくありません。ここで純粋な Java 正規表現ソリューションを探しています。前もって感謝します!