0

私はこのようなxmlを持っています

 <text>
        <h1>First title</h1>
        <p>First paragraph</p>
        <p>Second paragraph</p>
 </text>

そしてPerlスクリプト

my $file = '../data/text.xml';
my $parser = XML::LibXML->new();
my $doc = $parser->parse_file($file);
my $root= $doc->getDocumentElement;
$t=$doc->findnodes("//text")->get_node(1);
$text=encode_entities($t->findvalue('text'));

問題は、テキストを印刷しているときに、perl がこれらの 2 つの html タグを無視して、

「最初のタイトル 最初の段落 2番目の段落」

次に、ページのコンテンツが正しくありません。私に何ができる?サイクリングせずに各段落を手動で取得する方法はありますか? xml には、タイトルと段落、20 の段落、または段落、タイトル、別の段落、さらに小さなタイトルを含めることができます。ありがとうございました。

4

1 に答える 1

0
join q(), map { $_->toString } $doc->findnodes("//text")->get_node(1)->childNodes
于 2013-06-17T11:01:52.713 に答える