問題タブ [html-treebuilder]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - perl HTML::Treebuilder を使用してさまざまな要素 ID を見つける
組み込みの検索機能でウェブサイトを使用してデータを収集しようとしていますが、「検索」ボタンを押す方法がわかりません。これは、JavaScript がラップされており、ページの新しい反復ごとに ID が変化するためです。
サイトのセクションのデータは次のとおりです。
そして私のコード
悲しいことに、私のコードはノード値を返しません。
よろしくお願いします。
マイクロ
html - Perl で HTML を解析するときにコンテンツを取得できません
私はこれを解決しました: WWW::Mechanize でロードしていたページは、AJAX を使用して内部のすべてのコンテンツをロードする<tbody>
ため、$html 変数を作成したときにロードされません。次に、この動的コンテンツを取得する方法を確認する必要があります...
Web ページのテーブルのコンテンツを解析しようとしています。にはと<table>
が含まれます。テーブルの一部からコンテンツを取得しようとすると、そこに何もないことがわかります。内にあるコンテンツのみを取得します。<thead>
<tbody>
<tbody>
<thead>
次のようにいくつかの異なる方法を試しましたが、<tbody>
.
HTML::TreeBuilder の使用
HTML::TableExtract の使用
テーブルのを実行しようとすると、print Dumper($table);
を見つけて、<table>
内のテーブル コンテンツ<thead>
または<tbody>
からのすべてのコンテンツを含むその親への参照のみを表示できることを示しています<thead>
。
のコンテンツについてはあまり気にしません。<thead>
のテーブル コンテンツが必要なだけです<tbody>
。
何が間違っているのか、ここからどこへ行けばよいのかわかりません。
html - HTML-TreeBuilder-XPath findnodes() メソッドを使用して、一致した結果を 1 つずつ出力する際に提案が必要です
Perl でHTML-TreeBuilder-XPathを使用して、html コンテンツを解析しています
。必要なデータの xpath の場所を取得しました。私が直面している問題は、$html->findnodes()
単一の結果によって返される xpath の一致がいくつかありますが、1 つずつ印刷する必要があります。いくつかの提案が必要です。ありがとうございます。
xml - 構造体フィールドへのアクセス (XML パッケージ)
HTMLTreeParser を使用してこの構造を取得し、ページにテキストを含める必要があります。
「p」ブロックにあるものを探しています。今日、私を助けることができるものは何も見つかりませんでした。
では、どうすればそれらのデータを取得できますか?
perl - HTML::Tree を使用して HTML タグの値を取得する方法は?
以下に示すように、body タグの内容を保持する配列があるとします。 print Dumper(\@array);
@array の内容から「div」タグの ID を取得したいとしましょう。
私はそれを次のように行います:
これは、属性に単一の値がある場合にうまく機能します。しかし、@array の script タグから 866346569493123700 を取得するにはどうすればよいでしょうか?
私は何時間もこれを手に入れようとしてきたので、これに関する助けは大歓迎です
perl - htmlファイルからのPerl抽出パターン
リンクでいっぱいの .html ファイルがあります。http:// を付けずにドメインを抽出し (リンクのホスト名部分のみ、たとえば blah.com)、それらをリストして重複を削除したいと考えています。
これは私がこれまでに思いついたことです-問題は $tree データを渡そうとしている方法だと思います
html - perlを使用してHTMLテーブルをテキストに変換する
perlの助けuse HTML::TreeBuilder
を借りて、同じ構造のテキストに変換しようとしている html テーブルのコンテンツがあります。use HTML::FormatText
私はこのコードで試しました
予想される出力は次のとおりです。
しかし、私が得る出力は次のようなものです:
何か提案が必要です。