辞書 API から定義を解析しています。この行のxmlがあります
<dt>:any of a small genus (<it>Apteryx</it>) of flightless New Zealand birds with rudimentary wings, stout legs, a long bill, and grayish brown hairlike plumage</dt>
dt 要素の完全な行を取得するにはどうすればよいですか。私の問題は、要素に追加のタグがあるため、この部分(Apteryx)まで来ると機能しないことです。dt 要素全体を 1 つの文字列全体として取得するにはどうすればよいですか。これが私の現在のコードです。
Element def = (Element) element.getElementsByTagName("def").item(0);
System.out.println(getValue("dt",def).replaceAll("[^\\p{L}\\p{N} ]", ""));
def は dt 要素を保持する要素です。
そして、ここに私のgetValueコードがあります
private static String getValue(String tag, Element element)
{
NodeList nodes = element.getElementsByTagName(tag).item(0).getChildNodes();
Node node = (Node) nodes.item(0);
return node.getNodeValue();
}
dt 要素内に複数のネストされたタグがある場合があります