XMLファイルのテキストコンテンツ(文字データ)を一連の正規表現と照合し、照合に基づいてXMLを変更しようとしています。例:
<text>
<para>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.
</para>
</text>
たとえば、次の正規表現をテキストに一致させたいと思います。
\bdolor.\b
試合ごとに、たとえば試合をタグなどで囲みたいので、上記は次のようになります。
<text>
<para>Lorem ipsum <bold>dolor<bold/> sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et <bold>dolore<bold/> magna aliqua.
</para>
</text>
さらに厄介なのは、照合したいテキスト(文字データ)が複数のタグにまたがる可能性があることです。
私がやろうとしていることは、テキストの一致する部分を選択し、たとえば一致/選択されたテキストのフォーマットを変更する検索を実行した場合に、ワードプロセッサアプリが実行する必要があることと非常に似ていると思います。
これを行うためにJava(実際にはClojure)を使用したいと思います。また、JAXBを使用してXMLドキュメントを操作する予定です。
上記を行うにはどうすればよいですか?