ウィキペディアの XML ファイルを読んでいますが、中かっこの間をすべて削除する必要があります。たとえば、次の文字列の場合:
String text = "{{Use dmy date|date=November 2012}} {{Infobox ミュージカル アーティスト <!-- Wikipedia:WikiProject_Musicians を参照 --> | name
= ラス・コンウェイ | 画像 = | キャプション = 1959 年の [[Extended play|EP]] ''More Party Pops'' の前面に描かれているラス コンウェイ。| | 画像サイズ = | 背景 = non_vocal_instrumentalist | birth_name = トレバー・ハーバート・スタンフォード | エイリアス = | 生年月日 = {{生年月日|1925|09|2|df=y}} | 出生地 = [[ブリストル]]、[[イングランド]]、イギリス | Death_date = {{死亡日と年齢|2000|11|16|1925|09|02|df=y}} | Death_place = [[イーストボーン]]、[[サセックス]]、イングランド、イギリス | 起源 = | 楽器 = [[ピアノ]] | ジャンル = | 職業 = [[音楽家]] | year_active = | レーベル = EMI (コロンビア)、Pye、MusicMedia、チャーチル | チャーチル | 関連付けられた行為 = | ウェブサイト = | notable_instruments = }}";
空の文字列に置き換える必要があります。この例には、複数の改行とネストされた {{...}} があることに注意してください。
次のコードを使用しています。
Pattern p1 = Pattern.compile(".*\\({\\{.+\\}\\}).*", Pattern.DOTALL);
Matcher m1 = p1.matcher(text);
while(m1.find()){
String text1 = text.replaceAll(m1.group(1), "");
}
私は正規表現を初めて使用します。何が間違っているのか教えてください。