ルート ノードの子ノードとして直接表示されるすべてのテキスト要素を抽出したいと思います。を使用してJava標準のsax機能を一目見ました。しかし、パスを認識しているようには見えません。DefaultHandler
問題は、 text-nodes のみを抽出するfirst-level only
のではなく、ノードを取得することです。
これを行うための非DOM指向のアプローチはありますか? (ノード名は事前にわからないことに注意してください)
[編集]
サンプル入力
<root>
<a>text1</a>
<b>text2</b>
<c>text3</c>
<nested>
<d>not_text4</d>
...
<nested>
...
</root>
サンプル出力
Map<String, String> map := {
{a, text1}
{b, text2}
{c, text3}
}
現在、DOM 指向の回避策として解決されています。SAX / STAX の xpath 式のサブセットを提供するライブラリは存在しますが。