html - libxml を使用した xml からの html タグ

Question

私はこのようなxmlを持っています

 <text>
        <h1>First title</h1>
        <p>First paragraph</p>
        <p>Second paragraph</p>
 </text>

そしてPerlスクリプト

my $file = '../data/text.xml';
my $parser = XML::LibXML->new();
my $doc = $parser->parse_file($file);
my $root= $doc->getDocumentElement;
$t=$doc->findnodes("//text")->get_node(1);
$text=encode_entities($t->findvalue('text'));

問題は、テキストを印刷しているときに、perl がこれらの 2 つの html タグを無視して、

「最初のタイトル最初の段落 2番目の段落」

次に、ページのコンテンツが正しくありません。私に何ができる？サイクリングせずに各段落を手動で取得する方法はありますか? xml には、タイトルと段落、20 の段落、または段落、タイトル、別の段落、さらに小さなタイトルを含めることができます。ありがとうございました。

score 0 · Accepted Answer

0

join q(), map { $_->toString } $doc->findnodes("//text")->get_node(1)->childNodes

于 2013-06-17T11:01:52.713 に答える

html - libxml を使用した xml からの html タグ

1 に答える 1

Related

Reference