このXMLファイルがあり、「mono」要素からHTMLコードを抽出する必要がありますが、htmlタグが必要です。Groovyプログラミング言語を使用する必要があります。
「mono」要素内のすべてのdivは、divを含むHTMLタグです。
前もって感謝します。
<dataset>
<chapters>
<chapter id="700" name="Immunology">
<title>Immunology</title>
<monos>
<mono id="382727">
<div>
<h1>blah blah</h1>
</div>
<div>
<p>blah blah</p>
</div>
</mono>
</monos>
</chapter>
<chapter id="701" name="hematology">
<title>Inmuno Hematology</title>
<monos>
<mono id="blah blah">
<div>
<h1>blah blah</h1>
</div>
<div>
<div class="class1">blah blah</div>
</div>
</mono>
</monos>
</chapter>
</chapters>
</dataset>
私が試してみました :
import javax.xml.parsers.*;
xml = new XmlParser().parse("languages.xml")
println("There are " +xml.chapters.chapter.size() +" Chapters")
for (int i = 0; i < xml.chapters.chapter.size(); i++) {
def chapter = xml.chapters.chapter[i]
def chapterName = chapter.'@name'
println chapterName
println("---- Monos List ----\n\n")
for (int j = 0; j < chapter.monos.mono.size(); j++) {
def mono = chapter.monos.mono[j]
println("Mono Content: " + mono.toString());
}
println("---- End Monos List ----\n\n")
}
しかし、私は次の出力を取得します。
2つの章があります免疫学----モノリスト----
モノラルコンテンツ:mono [attributes = {id = 382727}; value = [div [attributes = {}; value = [h1 [attributes = {}; value = [blah blah]]]]、div [attributes = {}; value = [p [attributes = {}; value = [blahblah]]]]]]----エンドモノリスト----
血液学----モノリスト----
モノラルコンテンツ:mono [attributes = {id = blah blah}; value = [div [attributes = {}; value = [h1 [attributes = {}; value = [blah blah]]]]、div [attributes = {}; value = [div [attributes = {class = class1}; value = [blahblah]]]]]]----エンドモノリスト----