問題タブ [htmlunit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
926 参照

java - GAEでのHtmlUnit/HttpUnitの使用

HtmlUnit、HttpUnit、または同様のライブラリを使用して、アプリケーション(Google App Engineで実行)にWebページのDOMを読み込もうとしています。

誰かが似たようなことをすることができましたか?

0 投票する
1 に答える
382 参照

javascript - DOM にフォームがない場合に選択/オプション リストを取得する方法

次の Html のチャンクを取得しました...

選択用のページ/コンテンツは、javascript 関数/呼び出しによって生成されます... ページをフェッチできるので、HtmlPage インスタンスを取得します。

DOM に「フォーム」要素がないため、select/options を取得する方法がわかりません。これを処理するコードのチャンクへのポインタをいただければ幸いです。

実際の Html は次のとおりです。

0 投票する
2 に答える
3619 参照

java - HtmlUnitはJavaScriptリダイレクトを処理できますか?

JavaScriptリダイレクトを自動的に追跡する代わりに、JavaScriptがリダイレクトしたいURLをHtmlUnitに返すように強制できますか?

// コンテクスト:

5つのJavaScriptリダイレクトが連続している場合、停止したページのURLしか表示されません。実行された5つのURLは表示されません。

おそらく、リダイレクトを探すためにロガーをコールバックメソッドに接続できますか?これが可能かどうか、またはそれがどのように機能するかはわかりません。

0 投票する
1 に答える
6567 参照

javascript - htmlunit JavaScript の質問

ここでの他の回答と同様に、「ネット」を調べました..

次の html のようなものがあります。

私は運がないので次のことを試しました

だから..実行行に何を入れるべきかを理解しようとしています..

何かのようなもの

ありがとう

0 投票する
2 に答える
2083 参照

java - Java: JavaScript エラーで HtmlUnit がクラッシュする

時折、HtmlUnit が JavaScript エラーに出くわし、アプリケーション全体がダウンする重大なエラーが発生することがあります。

これが吐き出す長いスタックトレースです:http://pastie.org/806625

スクリプト エラーで例外をスローしないように webClient を既に設定しましたが、これは役に立たないようです。

Java がこの例外から回復して、アプリケーションの残りの部分を引き続き実行できるようにするために何かできることはありますか?

0 投票する
7 に答える
10531 参照

python - Pythonによる画面スクレイピング

PythonにはJavaScriptサポートを提供するスクリーンスクレイピングライブラリがありますか?

私は単純なHTMLリクエストにはpycurlを使用し、JavaScriptサポートを必要とするより複雑なリクエストにはJavaのHtmlUnitを使用しています。

理想的には、Pythonからすべてを実行できるようにしたいのですが、それを実行できるライブラリはありません。それらは存在しますか?

0 投票する
2 に答える
9198 参照

java - HtmlUnit Cookieをファイルに保存する方法は?

HtmlUnit Cookieをファイルに保存し、次回の実行時にそのCookieからロードしたいと思います。どうやってやるの?ありがとう。

0 投票する
1 に答える
1437 参照

java - HtmlUnitでHEADリクエストを投稿する方法は?

既存のWebClientを使用してカスタムHEADリクエストを投稿するにはどうすればよいですか?つまり、ページにフォームがないので、リクエストのプロパティを手動で設定したいと思います。

0 投票する
4 に答える
10083 参照

java - HtmlUnitのWebClientに画像とCSSをダウンロードするように指示するにはどうすればよいですか?

通常のWebブラウザと同じように、WebClientに外部のcssスタイルシートと画像本体をダウンロードさせるにはどうすればよいですか?

0 投票する
1 に答える
464 参照

java - HtmlUnit の奇妙な動作 (バグ?)

これを見てください:

このコードを実行すると、FileNotFoundException がスローされます。これは、ページの HTTP ステータス コードが 404であり、User-Agent が に設定された GET メソッドで同じページを再度取得するためJava-...です。ページを取得するのはなぜですか (「通常の」ステータス コードでは発生しません)。これはバグですか?ありがとう

サーバーの応答全体は次のとおりです。

クライアントに何かを取得するように指示する場所はどこですか? そして、どうすれば WebClient にそれを無視させることができますか?

HTTPDebugger のスクリーンショットを次に示します 代替テキスト 。ここでの問題は、2 番目の要求が送信される理由と、別のユーザー エージェントで送信される理由がわからないことです。