問題タブ [simpledom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - PHP シンプルな HTML DOM パーサー: 親 div の内容を取得する方法
ページ上のテキストのメインコンテンツ/本文を取得することを目的として、さまざまな (ニュース) サイトを (PHP の単純な HTML DOM を使用して) スクレイピングしています。
これを行うには、メインのヘッダー/見出し (H1) を見つけて、このヘッダー タグと同じ div 内に含まれるテキストを取得するのが最善の方法でした。
以下の両方の例で、(親?) div 全体の内容を取得するにはどうすればよいでしょうか。
Div はツリーのさらに上にある可能性があります。
ツリーをさらに上に分割します。
次に、それぞれのサイズを比較して、メインの div を決定できます。
php - 単純な DOM を使用して画像を解析する
シンプルな dom を使用して、HTML ファイルから画像を解析したいと考えています。今まで正規表現を使っていたのですが、これはダメだと言われましたので、dom を試してみました。
TEST.html
空白のページが表示され、エラー ログを確認しましたが、ありません。DOM に関するチュートリアルに従いましたが、間違っていましたか?
また、HTML コードを持つ変数から img を解析できますか? 私が意味したのは:
php - 単純な dom パーサー double find() が機能しませんか?
上記は私のDOMで、4時間前に取得する予定ですが、エラーが発生しました
私のphpは次のようになります
私は1つのfind()でできることを知っていますが、それはそうなるでしょうfind('tagline .live-timestamp')
が、なぜ二重のfind()が機能しないのだろうか.
php - PHP の curl は、同じ DOM ページで異なる動作をします
以下のコードを実行するとうまくいきましたが、次の URL で試してみると空白の画面が表示されます: https://www.reddit.com/r/funny/comments/3aguyp/i_told_my_boyfriend_the_new_puppy_wasnt_allowed/
2 ページの DOM 構造は同じです。
php - 単純な DOM パーサー php を使用してスパン コンテンツ テキストを取得する
私は次のdivを持っています、
class="mm_panel_text" にアクセスしてコンテンツの日付を取得したいのですが、コードを書いたのですがうまくいきません。
このクラスには多くの div があります。そのため、ループを使用してすべての要素のコンテンツにアクセスします。コードの問題は何ですか?何も表示されません。
php - シンプルな HTML DOM コードの問題
私は、HTML div コードを自分の Web サイト ページに取得し、Web サイトに表示するページに取り組んでいます。私のコードは次のようになります。
リンクに含まれているものは表示されません。ウェブサイトのページで、そのページの特定の div を表示したい。自分のページに特定の div が表示されるように、コードを編集/編集する必要があります。
編集:divをエコーしたいHTMLコード。
php - Foreachの爆発トリムは最後の日付の単純なdomパーサーを取ります
テキストdivから数えて3番目のdivから最後の日付のみを取得したい、以下のforeachを使用するのは私のコードです
1970 年 1 月 1 日の日付しか表示されません。日付を取得して今日の日付と比較することはできません ------------- クローラーしたいページの一部
php - HTML Simple DOM の結果を HTML テーブルに
HTML シンプル DOM に問題があります。解析から 2 つの列を持つ HTML テーブルへの結果を取得する必要があります。
私は次のコードを持っています: