問題タブ [simple-html-dom]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
730 参照

php - xamppでのsimplehtmldomの使用法

こんにちは仲間のコーダー、私はWebスクレイピングで新しいプロジェクトを試していて、それを行うためにsimplehtmldomを選択しました。私は、ローカルホストでプロジェクトをテストするためにxamppを使用しています。しかし、simplehtmldomの抽出されたzipファイルをxamppフォルダーのどこに置くかがわかりません。それを置く特定の場所はありますか、それともどこかに置いてソースコードにアドレスを指定する必要がありますか?

0 投票する
1 に答える
1463 参照

simple-html-dom - simplehtmldom500エラー

simplehtmldomに関するトピックはたくさんあるのを見ましたが、私の問題はないようです。具体的には、提供されている例でも、500秒しかないということです。エラーなしでファイルを含めることができることがわかりましたが、file_get_htmlを使用しようとすると、500秒になります。インストールに関するマニュアルで私が見つけた唯一のことは、allow_fopen_urlで発生する可能性のある問題です。

私が欠けているものはありますか?

0 投票する
1 に答える
2192 参照

php - SimpleHTMLDOMでこれをスクレイプする方法

単純なhtmldomを使用して、次のようなファイルから要素を抽出しようとしています。

  • このファイルには、同じように見えるテーブルがいくつかありますclass=sometable
  • 各テーブルにはいくつかあり<tr class=sometr>ます。
  • 次に、各trの中にth、タイトルのあるtdとカテゴリのあるtdがあります。

抽出したいのは、すべてのテーブルのすべてのテーブル行のすべてのタイトルclass=titleとそれに対応するカテゴリ番号です。class=categoryにファイルをロードしました$html。誰かが私がその後見つけることになっているものを教えてもらえますか?$collection = $html->find('tr');コレクションに対してvardumpを試しても何も得られなかったので、正しく選択していないようです。

0 投票する
1 に答える
805 参照

php - 複数の simple_html_dom() オブジェクトの作成

php シンプルな html dom ライブラリを使用して Web スクレイパーを作成しています。私はWebスクレイピングプロジェクトに取り組んでおり、あるphpページでスクレイピング用のhtmlページをロードし、その中で別のphpページで関数を呼び出して、htmlページまたはページをロードします。問題は、2 番目の HTML ページを読み込めないことです。以下は、スクレイピング用の html ページをロードするために両方のページで使用する関数です。先頭ページ

先頭ページ

コードが 2 番目の php ページを呼び出すと、次のエラーが発生します。

0 投票する
1 に答える
1494 参照

php - Simple HTML DOM gets only 1 element

I'm following a simplified version of the scraping tutorial by NetTuts here, which basically finds all divs with class=preview

http://net.tutsplus.com/tutorials/php/html-parsing-and-screen-scraping-with-the-simple-html-dom-library/comment-page-1/#comments

This is my code. The problem is that when I count $items I get only 1, so it's getting only the first div with class=preview, not all of them.

0 投票する
1 に答える
2399 参照

php - PHP シンプルな HTML DOM パーサーが死ぬ

シンプルな HTML DOM パーサーを使用して、多数のサブページを含むページをスクレイピングしています。何らかの理由で、最初の 40 のサブページは問題なく解析されますが、41 番になるとエラーなしで終了します。

このテスト ページを作成し、スクリプトで行うすべてのことと、単純な HTML DOM パーサーのいくつかのベネットを記録しようとしましたが、エラーを見つけることができませんでした。

URL番号41を解析するときになぜそれが起こるのか、誰にも分かりますか? または、単純な HTML DOM パーサーが失敗する場合があることを知っている人はいますか?

私のテストページ: http://snuzzer.dk/pub/shdp/parse.php

これは私のスクリプトで、単純な HTML DOM パーサーの変更されていないバージョンを使用しています。興味深いことが get_lections() で発生し、Simple HTML DOM Parser を呼び出す場所をマークしました。

0 投票する
1 に答える
747 参照

php - Kohana と Simple HTML Dom パーサーに問題がある

アプリケーションで Simple HTML Dom Parser を使用しようとしています。

コントローラーにscraping_slashdot()のサンプル関数を配置しました。

得る:

問題は、(Ko アプリの一部としてではなく) スタンドアロン ファイルでまったく同じことを行うと、すべて正常に動作するように見えることです。

誰かがそれが何であるか考えていますか?

PS

Ko 3.2 を使用して、他のバージョンを試したことはありませんが、このクラスを 3.0 で使用したことがあります。

0 投票する
2 に答える
11214 参照

httpwebrequest - HTTP/1.1 400 Bad Request を解決する方法

全て、

PHPでsimple_html_domを使用して、コマンドプロンプトからWebページにアクセスしています

$url はウェブ URL です。URL がhttp://abc.com/xyz.html?s= "sometext" のような場合、適切な応答が得られます。しかし、 http://abc.com/xyz.html?s= "some text" のように URL の get パラメータに空白が含まれていると、HTTP/1.1 400 Bad Request が発生します。

誰でもこの問題を解決する方法を教えてください。

前もって感謝します。

0 投票する
1 に答える
746 参照

php - PHP Simple HTML Dom パーサーを使用して既知の要素までテーブル行をトラバースする

PHP Simple HTML DOM Parserを使用して、この HTML テーブルから xml フィードを作成しようとしています。

私が目指しているのは、日付を抽出し、次の日付まで次の行を抽出することです。日付ごとに XML ノードを作成できるようにします。

現在、html の各日付を取得し、それぞれの xml ノードを構築しています

次の試合日までに各フィクスチャのチーム名などを取得するにはどうすればよいですか?

0 投票する
1 に答える
3861 参照

php - PHPHTMLDOMパーサーimgタグからaltを選択

単純なphphtmldomパーサーを使用して、imgタグからalt値のみを取得しようとしています。altタグを引くだけではうまくいかないようです。これが私が使っているものです:

私が使用する場合、それは機能し、画像タグ全体をプルします:

しかし、私が本当に欲しいのは、altタグの情報だけです。

http://www.amazon.com/gp/offer-listing/B001H8QHG0のAmazonオファーリストページでhtmlからプルしようとしています。

助言がありますか?

助けてくれてありがとう!