私はこれを解決しました: WWW::Mechanize でロードしていたページは、AJAX を使用して内部のすべてのコンテンツをロードする<tbody>
ため、$html 変数を作成したときにロードされません。次に、この動的コンテンツを取得する方法を確認する必要があります...
Web ページのテーブルのコンテンツを解析しようとしています。にはと<table>
が含まれます。テーブルの一部からコンテンツを取得しようとすると、そこに何もないことがわかります。内にあるコンテンツのみを取得します。<thead>
<tbody>
<tbody>
<thead>
次のようにいくつかの異なる方法を試しましたが、<tbody>
.
HTML::TreeBuilder の使用
my $tb = HTML::TreeBuilder->new();
$tb->parse($html);
my $table = $tb->look_down( _tag => 'tbody', id => 'tbody-id' );
HTML::TableExtract の使用
my $te = HTML::TableExtract->new( attribs => { id => 'table-id' } );
$te->parse($html);
my $table=$te->first_table_found;
テーブルのを実行しようとすると、print Dumper($table);
を見つけて、<table>
内のテーブル コンテンツ<thead>
または<tbody>
からのすべてのコンテンツを含むその親への参照のみを表示できることを示しています<thead>
。
のコンテンツについてはあまり気にしません。<thead>
のテーブル コンテンツが必要なだけです<tbody>
。
何が間違っているのか、ここからどこへ行けばよいのかわかりません。