問題タブ [domcrawler]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
170 参照

google-chrome-extension - 単一の Web ページの DOM をクロール/スクレイプして再レンダリングしますか?

特定の URL の Dom をクロール/スクレイピングし、別の URL で再レンダリングしたいと考えています。これはグロースハッキングツール用です

例として、ページhttp://x.com/x.htmlを再レンダリングしたいとします。

  1. http://example.com/render?url=http://x.com/x.htmlをブラウズします
  2. サーバー側でhttp://x.com/x.htmlのDOMコンテンツを吸います
  3. 吸い込まれた DOM コンテンツを再レンダリングし、すべての依存関係をそのまま維持します。

これの目的は、ChromeExtension によって行われるように DOM を操作することですが、拡張機能は必要ありません。これはどのブラウザでも機能します。

元の依存関係 (アセットの URL: 画像 / js / CSS...) をすべて保持しているので、同じデザインと追加の DOM 変更で同じページを再レンダリングできます。

私はいくつかの実験を行いましたが、これはうまくいきます。しかし、私の質問は、これはスケーラブルですか? 法的な面ではどうですか?元のウェブサイトの所有者によって (詐欺や詐欺の意図がなくても) 裁判にかけられることはありますか? 何かお勧めはありますか?

0 投票する
1 に答える
760 参照

php - このサイトから symfony クローラーが動作しない

このサイトからデータを取得したいのですが、symfony クローラーがhttp://www.varzesh3.com/livescore/feedに対して機能せず、文字列が取得されません

0 投票する
1 に答える
1901 参照

php - Symfony DOMCrawler はそれぞれからブレークします

HTML を DOMCrawler でフィルタリングしようとしていますが、結果が見つかった場合は中断する必要があります。

からの離脱は可能eachですか?
または、$node->text();使用するとどうすれば取得できますforeachか?それとも無理ですか?

HTML:

PHP:

ステータスを取得したい。そして、ステータスが「アクティブ」に等しい場合、ループを破りたいです。


わかりました、今私は何かを思いつきました。

しかし、今は 3 位になる方法がわかりませ<td><tr>