問題タブ [goutte]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
6050 参照

php - JSON を Goutte で解析することは可能ですか?

私は Web サイトのクロールに取り組んでおり、これまでのところ Goutte で HTML を解析するのに問題はありません。しかし、Web サイトから JSON を取得する必要がありますが、Cookie の管理のために、これを行いたくありません。うまくいきfile_get_contents()ません。

純粋な cURL を使用できますが、この場合は Goutte を使用したいだけで、他のライブラリは使用したくありません。

Goutteを介してテキストのみを解析できる方法はありますか、それとも古き良き方法でこれを行う必要がありますか?

ありがとうございました。

0 投票する
1 に答える
670 参照

html-entities - Behat を使用した Goutte: textarea 値としての xml 文字列は html エンティティで埋められます

テキストエリアを含むいくつかの入力要素を含むフォームを含むページがあります。これらの入力フィールドには、いくつかの値が入力されています。このページ全体を、エンティティの編集ページと考えてください。Textarea には、通常のブラウザ (firefox や chrome など) 内で適切に表示される XML 文字列が含まれており、次のようになります。

しかし、goutte mink ドライバーでテスト ケースを実行すると、ページが読み込まれ、textarea の値が次のように特殊文字でエンコードされます。

そして、送信ボタンを押すと、混乱がサーバーに送信され、最初の正しいxmlの代わりに保存されます。一切触れませんのでご了承ください。ページを読み込んで送信ボタンを押すだけで、すべてが台無しになります。これは痛風でのみ発生しますが、たとえば selenium2 では発生しません。

問題は、これらの html エンティティを goutte に自動的に解釈させ、エンコードされた混乱ではなく、正しいデータとして送信するにはどうすればよいですか?

0 投票する
1 に答える
529 参照

symfony - Goutte はフォームを送信しません

ホームページでの検索テストは問題なく動作します。しかし、送信がどのように機能し、どのようにデバッグするのかわかりません。それが私が持っているものです:

behat.yml

検索機能

バッシュ

したがって、アドレスはまだ「/」であり、フォームが送信されなかったことを意味します。

Goutte は、この目的に適していませんか? それとも私の奇妙な設定ですか(「/」はsymfony2によって提供されていないため、サイトの他の部分は提供されています)?

更新

BroserKit/Client 内からのデバッグは、フォームが送信されるはずの URI が間違っていることを示し、404 を返します。詳細モードでの Behat はそれを示しません。

0 投票する
1 に答える
1001 参照

php - guzzle のプロパティを goutte から変更するには?

上記のコードを実行すると、「アクティブなクラス スコープがない場合、parent:: にアクセスできません」というエラーが表示されます。では、Goutte から Guzzle のプロパティにアクセスするにはどうすればよいでしょうか?

0 投票する
1 に答える
3467 参照

php - Goutte から Guzzle Response にアクセスする

Goutte から Guzzle Response オブジェクトにアクセスしようとしています。そのオブジェクトには、私が使いたい素敵なメソッドがあるからです。たとえば、getEffectiveUrl です。

私が見る限り、コードをハッキングせずにそれを行う方法はありません。

または、応答オブジェクトにアクセスせずに、最後にリダイレクトされた URL を goutte から取得する方法はありますか?

0 投票する
2 に答える
2476 参照

php - Google Play スクレーパー

PHP で Play ストア レビュー スクレーパーを開発しようとしています。この URLhttps://play.google.com/store/getreviewsに POST リクエストを送信する必要があります。

私はGoutteライブラリを使用していますが、これが私のコードです:

問題は、リクエストが何も返さないことです。すでにこの問題に直面して解決した人はいますか?

0 投票する
1 に答える
726 参照

php - Symfony DomCrawler/Goutte はこれほど遅いはずですか?

私は、Guzzle、Symfony DomCrawler、および CssSelector を 1 つのパッケージに組み合わせた Symfony の Goutte ライブラリを使用して、かなり単純な HTML テーブルをスクレイピングしています。しかし、私はそれが信じられないほど遅いと感じています。

ページが読み込まれると、通常、20 行のテーブルを処理するのに約 12 ~ 14 秒かかります。確かにこれは長すぎますか?

以前に DOM 解析ライブラリを使用したことがあり、このような速度低下に遭遇したことはありません。私は何か間違ったことをしていますか、それともGoutteは非常に遅いですか?

0 投票する
2 に答える
4385 参照

php - スクリーンショットまたは HTML ページをキャプチャする Behat ステップを作成するにはどうすればよいですか?

理想的には、画像ビューアでスクリーンショットを自動的に開くこともできます。

0 投票する
1 に答える
713 参照

php - Goutte ドライバーからスクリーンショットをキャプチャする Behat ステップを作成するにはどうすればよいですか?

ブラウザーで開くことができるように、HTML をファイルに保存する必要があります。

0 投票する
1 に答える
4014 参照

php - Goutte を使用してメタ ディスクリプション コンテンツを取得する方法

Goutte を使用してメタ ディスクリプション、メタ キーワード、ロボット コンテンツからコンテンツを取得する方法を教えてください。また、どのようにターゲットを設定でき<link rel="stylesheet" href="">ます<script>か?

<title>以下は、コンテンツを取得するために使用した PHP です。

ここにGoutteへのリンクがあります - https://github.com/fabpot/goutte