問題タブ [simple-html-dom]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - xamppでのsimplehtmldomの使用法
こんにちは仲間のコーダー、私はWebスクレイピングで新しいプロジェクトを試していて、それを行うためにsimplehtmldomを選択しました。私は、ローカルホストでプロジェクトをテストするためにxamppを使用しています。しかし、simplehtmldomの抽出されたzipファイルをxamppフォルダーのどこに置くかがわかりません。それを置く特定の場所はありますか、それともどこかに置いてソースコードにアドレスを指定する必要がありますか?
simple-html-dom - simplehtmldom500エラー
simplehtmldomに関するトピックはたくさんあるのを見ましたが、私の問題はないようです。具体的には、提供されている例でも、500秒しかないということです。エラーなしでファイルを含めることができることがわかりましたが、file_get_htmlを使用しようとすると、500秒になります。インストールに関するマニュアルで私が見つけた唯一のことは、allow_fopen_urlで発生する可能性のある問題です。
私が欠けているものはありますか?
php - SimpleHTMLDOMでこれをスクレイプする方法
単純なhtmldomを使用して、次のようなファイルから要素を抽出しようとしています。
- このファイルには、同じように見えるテーブルがいくつかあります
class=sometable
。 - 各テーブルにはいくつかあり
<tr class=sometr>
ます。 - 次に、各trの中に
th
、タイトルのあるtdとカテゴリのあるtdがあります。
抽出したいのは、すべてのテーブルのすべてのテーブル行のすべてのタイトルclass=title
とそれに対応するカテゴリ番号です。class=category
にファイルをロードしました$html
。誰かが私がその後見つけることになっているものを教えてもらえますか?$collection = $html->find('tr');
コレクションに対してvardumpを試しても何も得られなかったので、正しく選択していないようです。
php - 複数の simple_html_dom() オブジェクトの作成
php シンプルな html dom ライブラリを使用して Web スクレイパーを作成しています。私はWebスクレイピングプロジェクトに取り組んでおり、あるphpページでスクレイピング用のhtmlページをロードし、その中で別のphpページで関数を呼び出して、htmlページまたはページをロードします。問題は、2 番目の HTML ページを読み込めないことです。以下は、スクレイピング用の html ページをロードするために両方のページで使用する関数です。先頭ページ
先頭ページ
コードが 2 番目の php ページを呼び出すと、次のエラーが発生します。
php - Simple HTML DOM gets only 1 element
I'm following a simplified version of the scraping tutorial by NetTuts here, which basically finds all divs with class=preview
This is my code. The problem is that when I count $items
I get only 1, so it's getting only the first div with class=preview
, not all of them.
php - PHP シンプルな HTML DOM パーサーが死ぬ
シンプルな HTML DOM パーサーを使用して、多数のサブページを含むページをスクレイピングしています。何らかの理由で、最初の 40 のサブページは問題なく解析されますが、41 番になるとエラーなしで終了します。
このテスト ページを作成し、スクリプトで行うすべてのことと、単純な HTML DOM パーサーのいくつかのベネットを記録しようとしましたが、エラーを見つけることができませんでした。
URL番号41を解析するときになぜそれが起こるのか、誰にも分かりますか? または、単純な HTML DOM パーサーが失敗する場合があることを知っている人はいますか?
私のテストページ: http://snuzzer.dk/pub/shdp/parse.php
これは私のスクリプトで、単純な HTML DOM パーサーの変更されていないバージョンを使用しています。興味深いことが get_lections() で発生し、Simple HTML DOM Parser を呼び出す場所をマークしました。
php - Kohana と Simple HTML Dom パーサーに問題がある
アプリケーションで Simple HTML Dom Parser を使用しようとしています。
コントローラーにscraping_slashdot()のサンプル関数を配置しました。
得る:
問題は、(Ko アプリの一部としてではなく) スタンドアロン ファイルでまったく同じことを行うと、すべて正常に動作するように見えることです。
誰かがそれが何であるか考えていますか?
PS
Ko 3.2 を使用して、他のバージョンを試したことはありませんが、このクラスを 3.0 で使用したことがあります。
httpwebrequest - HTTP/1.1 400 Bad Request を解決する方法
全て、
PHPでsimple_html_domを使用して、コマンドプロンプトからWebページにアクセスしています
$url はウェブ URL です。URL がhttp://abc.com/xyz.html?s= "sometext" のような場合、適切な応答が得られます。しかし、 http://abc.com/xyz.html?s= "some text" のように URL の get パラメータに空白が含まれていると、HTTP/1.1 400 Bad Request が発生します。
誰でもこの問題を解決する方法を教えてください。
前もって感謝します。
php - PHP Simple HTML Dom パーサーを使用して既知の要素までテーブル行をトラバースする
PHP Simple HTML DOM Parserを使用して、この HTML テーブルから xml フィードを作成しようとしています。
私が目指しているのは、日付を抽出し、次の日付まで次の行を抽出することです。日付ごとに XML ノードを作成できるようにします。
現在、html の各日付を取得し、それぞれの xml ノードを構築しています
次の試合日までに各フィクスチャのチーム名などを取得するにはどうすればよいですか?
php - PHPHTMLDOMパーサーimgタグからaltを選択
単純なphphtmldomパーサーを使用して、imgタグからalt値のみを取得しようとしています。altタグを引くだけではうまくいかないようです。これが私が使っているものです:
私が使用する場合、それは機能し、画像タグ全体をプルします:
しかし、私が本当に欲しいのは、altタグの情報だけです。
http://www.amazon.com/gp/offer-listing/B001H8QHG0のAmazonオファーリストページでhtmlからプルしようとしています。
助言がありますか?
助けてくれてありがとう!