2

私は Perl を初めて使用するので、使用経験がほとんどなく、TWIG と Perl を使用して、次の xml ファイルから CDATA 内のコンテンツを抽出する必要があります。

    <?xml version='1.0'  encoding="utf-8"?>
    <text>
    <![CDATA[
    1. Democracia ukata Estado de Derecho sutinchata kamachinaka ch’amanchañataki

    ...
    ]]>
    </text>

この質問がどこかで繰り返されていたら申し訳ありません。前もって感謝します。

4

1 に答える 1

6

xpath 式として使用twig_handlersしてフィルタリングを行うために使用します。#CDATA

の内容script.pl:

#!/usr/bin/env perl

use warnings;
use strict;
use XML::Twig;

my $twig = XML::Twig->new( 
    twig_handlers => {
        '#CDATA' => sub { print $_->text },
    },  
)->parsefile( shift );

次のように実行します。

perl script.pl xmlfile

それは以下をもたらします:

1. Democracia ukata Estado de Derecho sutinchata kamachinaka ch’amanchañataki

...
于 2013-07-10T18:14:11.400 に答える