問題タブ [simple-html-dom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - ネストされたの作成simple_html_dom.php の構造
さて、私はhttp://simplehtmldom.sourceforge.net/にある PHP ベースの simple_html_dom.php を使用して Web ページをスクレイピングしています。ページ。最終的には、そのリストを使用して jsTree を初期化する予定ですが、ステップ 1 を通過できません。これには単純で簡単な解決策があることは知っていますが、それを理解できないようです。何時間もかけてウェブを検索し、最終的にここに投稿することにしました。
基本的に、これを変換したい:
これに:
私が正しいと思う例は次のようになりますが、次のように生成されます: `
コード:
php - PHPでHTMLページを解析する
今日、Simple HTML DOM パーサーで 1 つのページを解析していたときに、結果が得られませんでした。だから私は、それは奇妙に違いないと思った。そこで、そこに書かれた HTML コードを見に行きました。間違いが多いことに気づきました。
そこで質問です。パーサーは正しく動作するが、HTML がめちゃくちゃな場合の状態での対処方法。たぶん、誰かが何らかのアプローチまたは処理できる他のパーサーを提案するでしょう。
助けてくれてありがとう。
php - 1つの要素ごとに2つ以上の属性を使用して、単純なhtmldomパーサーを使用してパーツを検索する
SimpleHTMLDOMパーサーはHTMLパーサーにとって本当に悪い選択だと多くの人が考えていることを私は知っています。それでも今は使う必要があります。
1つの要素につき2つ以上の属性で検索する方法が説明されている記事をいくつか読みました。彼らはそのようなものと配列フィルタリングの1つの可能性を提案しました
私の質問は、2つの属性によってパーツを見つけるためのネイティブの可能性についてです。マニュアルには見つかりませんでしたが、すべてがマニュアルに記載されているわけではありません。
誰かがそのような方法または類似tag2[attr1=value,attr2=value]
またはtag2[attr1=value attr2=value]
またはなどがあることを知っていますか?
php - `simple html dom` get site's images を使用するときに広告画像をフィルタリングする方法
simple_html_dom
いくつかのサイトの画像を取得するために使用したい。これはテストサイトです。以下の基本的なコードを使用すると、すべての画像を取得できます。しかし、広告画像をフィルタリングする方法は?
一部の広告が としても表示されていることに気付きましたjpg image format
が、URL にはad
またはads
、または何かが含まれていgif image format
ます ... 広告をフィルタリングするためのコードを作成するにはどうすればよいですか? ありがとう。
php - SimpleHTMLDom で絶対画像 URI を取得する方法
simple_html_dom
サイトの画像を取得するために使用します。ただし、画像のリンクの前に完全なドメイン URI が付けられていない場合があります (例: http://example.com
. それらは次のように表示されます
- images/_home-ss-21.jpg
- /_home-ss-22b.jpg
- ./_1249a7s.png または
- ../../../a19489s_20110412.jpeg.
これらの URI を、プロトコルとドメイン情報を含む絶対 URI に変換する方法を教えてください。
php - 最大の画像を取得
画像検索プロジェクトを作成していますが、1ページで最大の画像を取得したいと考えています。画像の実際のアドレスを修正し、広告の可能性がある画像を削除するためのコードを追加しました。そこの幅*高さを比較すると、最大のものがエコーアウトします。しかし、私のコードにはいくつかの問題があります。これが私のコード全体です。誰かが私がどこが間違っているのか、そしてコードを最適化する方法を修正するのを手伝ってくれますか?私はプロセスがゆっくりと苦いように感じます。ありがとうございます。
url_to_absolute.php
php - HTML DOM パーサーが JavaScript カウントダウンを取得できない
http://simplehtmldom.sourceforge.net/の HTML DOM パーサーを使用しています
次に、ソース リンクのカウントダウン JavaScript からテキストを取得できないという問題があります。
ソースからのコード: (これはカウントダウン JavaScript です)
私のコード:
次に出力: (コロン付きの空白)
php - simple_html_dom を使用して ul を解析する
このulの各スパンの内部テキストを取得したいと思います。
私は今これを持っていますが、スパンごとに同じコードを書き直さずにやりたいです。
php - モバイル Web サイトからのコメント付き HTML の解析
この html を simple_html_dom で解析しようとしていますが、そのほとんどはコメントされていますが、どうすればそれを回避できますか? (モバイルページです)。
....
php - PHP Simple HTML DOM, Notice: 非オブジェクトのプロパティを取得しようとしています
私は取得Notice: Trying to get property of non-object
しています:
$article はsimple_html_dom()
オブジェクトです。