2

GroovyでXmlParserを使用してhtmlページを読んでいます。

私が使用しているコードは次のとおりです。

tr?.td?.each{
 println it
}

次のように出力します。

td[attributes={colspan=9, width=129}; value=[p[attributes={}; value=[O-???????????]]]]

ページには Unicode テキストが含まれていますが、印刷すると:

it.text()

それは何も印刷しません。in のコンテンツを取得したい。

4

2 に答える 2

0

あなたが説明した動作を取得できません。与えられた

def xml = '''<html>
    <body>
        <table>
            <tr>
                <td>Woo</td>
                <td>Yay</td>
            </tr>
            <tr>
                <td>Woo</td>
                <td>Yay</td>
            </tr>
        </table>
    </body>
</html>'''

import groovy.xml.*

new XmlParser().parseText( xml ).body.table.tr.td.each {
    println it.text()
}

版画

Woo
Yay
Woo
Yay
于 2013-08-13T07:34:12.753 に答える