テーブルの内容に基づいて特定のテーブルを削除する必要があります。HTML::Tree
HTMLツリーを構築するためにを使用してHTMLを解析しました。
以前replace_with_content
はテーブルを削除していましたが、テーブルタグが削除され、テーブルの内容が残るだけです。
テーブルはネストされていることに注意してください。
my $content = get($url);
my $tree = HTML::Tree->new();
$tree->parse($content);
my (@table_tags) = $tree->look_down( '_tag' , 'table' );
my $string = $table_tags[0]->as_HTML;
my $tree2 = HTML::Tree->new();
$tree2->parse($string);
my (@table_tags2) = $tree2->look_down( '_tag' , 'table' );
$table_tags2[3]->replace_with_content();