問題タブ [htmlunit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Jwebunitとワードプレス
Jwebunit を使用して wordpress で実行されている自分の Web サイトにログインしようとしています。
上記はエラーをスローしませんが、ページは送信されません。間違ったパスワードを試すとエラーがスローされますが、すべての値が正しい場合、送信は新しいページに移動しません。
なぜこれが起こっているのでしょうか?
javascript - Celerityを使用してファイルをダウンロードする
JRubyでCelerityを使用して、特定のWebサイトからの.csvファイルのダウンロードを自動化しています。Webサイトの1つ(LinkShare)については、非常に近づいていますが、最後のステップを理解できません。
ウェブサイトはjavascriptと「hiddeniframe」メソッドを使用してファイルのダウンロードをプッシュします-通常のブラウジング中にダウンロードボタンをクリックすると、ダウンロードコンテンツを含む非表示のiframeを作成するjavascriptが呼び出され、ブラウザがそれを取得してユーザーにプロンプトを表示しますファイルを保存します。
明らかに、Celerityではまったく同じようには機能しません。リンクをクリックすると、jirbに新しいiframeが表示されますが、メソッドを呼び出すことができず、次のようなエラーが発生します。
Celerity / Htmlunit / Javascript / Jrubyの経験が豊富で、私を正しい方向に向けることができる人はいますか?ダウンロードコンテンツ(.csvファイル)を取得したいだけです。
あるいは、タスクに適した(ヘッドレス)ブラウザー自動化ツールが存在する場合は、それを知っている人はいますか?
htmlunit - HTMLUnitログインと数回のクリックの実用的な例はありますか
おそらくJavascriptテストサポートを示しています
しかし、私は得る:
2010年11月17日15:41:14com.gargoylesoftware.htmlunit.IncorrectnessListenerImplnotify警告:廃止されたコンテンツタイプが見つかりました:'text/javascript'。BUILD SUCCESSFUL(合計時間:4秒)
ユニットテストとして実行されず、合格/不合格などが表示されるため、これは役に立ちません。
NetBeans6.9.1を使用しています
screen-scraping - HtmlUnit の代替
これまでに利用可能なヘッドレス ブラウザーについて調査したところ、HtmlUnit がかなり広く使用されていることがわかりました。HtmlUnit と比較して有利な HtmlUnit の代替手段はありますか?
ありがとうネイン
xpath - Groovy htmlunit getByXPath
現在、HtmlUnit を使用してページから href を取得しようとしていますが、問題が発生しています。
XPath は次のとおりです。
Web ページでは次のように表示されます。
私のコードでは、次のことを行っています。
ただし、これは、必要な URL だけでなく、そこにあるすべてのものを返しています。
hrefを取得するために何を追加する必要があるかを誰かが説明できますか? (また、.html で終わらない)
sockets - socketaddressを使用してHtmlUnitでプロキシを設定するには?
ソケットアドレスを使用して HtmlUnit でプロキシを設定する方法を知る必要がありますか? 私は次のことを試しました..
ここでエラーが発生します..!
htmlunit - JavaHtmlUnit-wordpressにログインできません
HtmlUnitを使用してローカルのワードプレスWebサイトにログインしようとしていますが、Cookieの問題があるようです。
これがコードの始まりです。
それが私がログに記録するものです。誰かアイデアがありますか?ありがとう。
2010年11月27日12:43:35PMorg.apache.http.client.protocol.ResponseProcessCookies processCookies警告:Cookieが拒否されました: "[バージョン:0] [名前:wordpress_2418eeb845ebfb96f6f1a71ab8c5625a] [値:+] [ドメイン:localhost][パス:/週-flowersWp / wp-admin] [有効期限:金11月27日12:43:35IST2009]」。パス属性「/flowersWp/wp-admin」が無効です。発信元のパス: "/flowersWp/wp-login.php"
htmlunit - HtmlUnit は、要素を取得する前に HTML を解析しますか。HtmlUnit によって生成されたリクエストを取得する方法
1) HtmlUnit は要素を取得する前に HTML を解析しますか? オフにできますか?最長の操作の 1 つと思われます。HtmlElementを実際に作成するのではなく、自分で応答全体を解析したいと思います(ただし、誰かがその方法を教えてくれれば便利です)が、コンテンツを取得するだけです。
2) HtmlUnit でリクエストをホストに送信する方法はありますか?
3) 新しい setStatusHandler を設定すると ExceptionOnFailingStatusCode がスローされますか? デフォルトの StatusHandler はありますか? 延長できますか?
seo - htmlunit+page.asXmlメソッドを使用してDoctypeを保持するにはどうすればよいですか
HtmlUnitを使用してpage.asXml()を実行すると、ページのDoctypeが失われます。回避策はありますか?
注:目的は、GoogleにDOMを提供することです。
xpath - HtmlUnit getByXpath が null を返す
私はGroovyでコーディングしていますが、それが言語固有の一連の質問だとは思いません。
私は実際に2つの質問があります
最初の質問
HtmlUnit の使用中に問題が発生しました。私がつかもうとしているのはヌルだと言っています。
私がテストしているページは次のとおりです。 http://browse.deviantart.com/resources/applications/psbrushes/?order=9&offset=0#/dbwam4
私のコード:
これは単純に出力します: []
これは、ページがonclick()を使用しているためですか? もしそうなら、どうすればそれを回避できますか?JavaScript を有効にすると、cmd プロンプトが混乱します。
2 番目の質問
画像も取得したいのですが、(firebug を介して) XPath を取得しようとすると次のように表示されるため、問題が発生しています: //*[@id="gmi-ResViewSizer_img"]
どうすればそれを処理できますか?