問題タブ [html-treebuilder]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
946 参照

javascript - perl HTML::Treebuilder を使用してさまざまな要素 ID を見つける

組み込みの検索機能でウェブサイトを使用してデータを収集しようとしていますが、「検索」ボタンを押す方法がわかりません。これは、JavaScript がラップされており、ページの新しい反復ごとに ID が変化するためです。

サイトのセクションのデータは次のとおりです。

そして私のコード

悲しいことに、私のコードはノード値を返しません。

よろしくお願いします。

マイクロ

0 投票する
1 に答える
339 参照

html - Perl で HTML を解析するときにコンテンツを取得できません

私はこれを解決しました: WWW::Mechanize でロードしていたページは、AJAX を使用して内部のすべてのコンテンツをロードする<tbody>ため、$html 変数を作成したときにロードされません。次に、この動的コンテンツを取得する方法を確認する必要があります...


Web ページのテーブルのコンテンツを解析しようとしています。にはと<table>が含まれます。テーブルの一部からコンテンツを取得しようとすると、そこに何もないことがわかります。内にあるコンテンツのみを取得します。<thead><tbody><tbody><thead>

次のようにいくつかの異なる方法を試しましたが、<tbody>.

HTML::TreeBuilder の使用

HTML::TableExtract の使用

テーブルのを実行しようとすると、print Dumper($table);を見つけて、<table>内のテーブル コンテンツ<thead>または<tbody>からのすべてのコンテンツを含むその親への参照のみを表示できることを示しています<thead>

のコンテンツについてはあまり気にしません。<thead>のテーブル コンテンツが必要なだけです<tbody>

何が間違っているのか、ここからどこへ行けばよいのかわかりません。

0 投票する
2 に答える
64 参照

html - HTML-TreeBuilder-XPath findnodes() メソッドを使用して、一致した結果を 1 つずつ出力する際に​​提案が必要です

Perl でHTML-TreeBuilder-XPathを使用して、html コンテンツを解析しています 。必要なデータの xpath の場所を取得しました。私が直面している問題は、$html->findnodes()単一の結果によって返される xpath の一致がいくつかありますが、1 つずつ印刷する必要があります。いくつかの提案が必要です。ありがとうございます。

0 投票する
1 に答える
124 参照

xml - 構造体フィールドへのアクセス (XML パッケージ)

HTMLTreeParser を使用してこの構造を取得し、ページにテキストを含める必要があります。

「p」ブロックにあるものを探しています。今日、私を助けることができるものは何も見つかりませんでした。
では、どうすればそれらのデータを取得できますか?

0 投票する
1 に答える
221 参照

perl - HTML::Tree を使用して HTML タグの値を取得する方法は?

以下に示すように、body タグの内容を保持する配列があるとします。 print Dumper(\@array);

@array の内容から「div」タグの ID を取得したいとしましょう。

私はそれを次のように行います:

これは、属性に単一の値がある場合にうまく機能します。しかし、@array の script タグから 866346569493123700 を取得するにはどうすればよいでしょうか?

私は何時間もこれを手に入れようとしてきたので、これに関する助けは大歓迎です

0 投票する
2 に答える
282 参照

perl - htmlファイルからのPerl抽出パターン

リンクでいっぱいの .html ファイルがあります。http:// を付けずにドメインを抽出し (リンクのホスト名部分のみ、たとえば blah.com)、それらをリストして重複を削除したいと考えています。

これは私がこれまでに思いついたことです-問題は $tree データを渡そうとしている方法だと思います

0 投票する
1 に答える
736 参照

html - perlを使用してHTMLテーブルをテキストに変換する

perlの助けuse HTML::TreeBuilderを借りて、同じ構造のテキストに変換しようとしている html テーブルのコンテンツがあります。use HTML::FormatText私はこのコードで試しました

予想される出力は次のとおりです。

しかし、私が得る出力は次のようなものです:

何か提案が必要です。