問題タブ [jaunt-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - java および jaunt-api を使用して Web ページにログインする際の問題
Jaunt を使用して Web ページにログインしようとしています。最初に言及することは、Web ページが .aspx で、送信ボタンにオプションがあるonclick="javascript:WebForm_DoP..."
ことです。私の知る限り、Jaunt は Javascript をサポートしていませんよね? 私が間違っている場合に備えて、私が使用しているコードは Jaunt の例のものです。
Web ブラウザーを使用してログインできるため、すべての名前と値が正しく、ユーザーとパスワードが機能します。コードを実行すると、出力に次のように表示されます。
メッセージ: UserAgent.sendPOST; Connection error requestUrl: http://webpagehere.com/default.aspx [posting __VIEWSTATE=%2FwEPDwUJLTk5MDc0NjQ2ZBgBBR5fX0NvbnRyb2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WAgURTG9naW4xJFJlbWVtYmVyTWUFF0xvZ2luMSRMb2dpbkltYWdlQnV0dG9upWcarODJIwpeMt8HCmfaBn6iMWI%3D&__VIEWSTATEGENERATOR=CA0B0334&Login1%24UserName=USER&Login1%24Password=PASSWORD&Login1%24LoginButton=GO] response: [none]
フォーム div は次のとおりです。
私の問題は何ですか?Jaunt でこのログインが許可されない場合、誰かが Web スクレイピングとインタラクション用のライブラリを勧めてくれませんか? ありがとう!
java - Jaunt-api Cookie の問題
jaunt-api を使用して yahoo メールにログインしようとしていますが、「cookie が有効になっていない問題」が発生します。私はjaunt-apiが初めてなので、助けてください。次のコードを使用しています。
html - Jaunt - 特定の要素があるかどうかを確認します
Nutch を使用して Web サイトをクロールし、現在プラグインを作成しています。Jaunt 1.0.0.1 は、HTML の解析に使用されます。たとえば、私は行を持っています
ページ上が no の場合、エラーが発生します<div class=info_books_item>
。現在、Jaunt JavaDocs を見ていますが、そのような要素があるかどうかを確認する方法がわかりません。
java - Jaunt webcrawler - Google 検索結果の次のページにアクセスできない
最初のページだけでなく、Google からより多くの検索結果を返したい。したがって、2 番目for-loop
は基本的に次のページの結果を返す必要がありますが、そうではありません。理由はありますか?
java - Java と Jaunt API を使用して、複雑な名前 (入力タグにドット表記) を含む HTML フォームに入力する
- 皆さん、
私は Java ツールを構築しており、input
Java とJaunt API
.
HTML コードは次のようになります。
「通常の」入力フィールドに入力するための Java コードreference
(動作します) は次のようになります。
残念ながら、searchprofile.surname
名前にドット表記を使用するフィールドに入力することはできません
これが私が試したもののサンプルです(成功せずに):
これらのコマンドごとに NotFoundException が発生し、Jaunt でこれを実行できるかどうかわかりません。
この点に関して、あらゆる種類の助けをいただければ幸いです。
前もって感謝します
編集 - searchprofile.surname
JSoup でドット表記の入力フィールドに到達する方法はありますか?
HTML はname
-Attribute でドットを使用できますが、Jaunt はこれを受け入れますabc.name
か?
java - Jsoup パーサーによる HTML データ抽出
次の HTML から、指定された形式でデータを抽出する最良の方法は何ですか。
期待される出力:
ITEM_NAME : ティーカサラダ
ITEM_DESCRIPTION : ケール、ヒマワリの芽、キノア、アボカド、グレープ トマト、アルファルファもやし、ニンジン、キュウリのドレッシング。
ITEM_PRICE: $9.95
ITEM_IMG : /yelp_images/s3-media4.fl.yelpcdn.com/bphoto/1P50jjYUA4ofx5hF85wm5Q/ms.jpg
Jsoup と Jaunt を使用してさまざまな方法を試しました。まだそれを理解することができません。
web-scraping - Jaunt Webcrawler API が相対 URL を正しく処理しない
次のようなクローラーを実装します。
クロールしているページは
https://www.mercadoribeirao.com.br
次のようなすべてのリンクを取得しています:
最初のページでは、次のようにリンクを正しく取得します。
しかし、サブページにアクセスすると、URL が正しく連結されません。
おそらく、ベースページではなく、URL の最後にリンクを連結するために、相対リンクを自動的に完成させようとするためです。
作成されたこれらの新しいリンクは何らかの理由で正しいものであり、常に新しいリンクにアクセスする必要があり、これは無期限に発生し、プロセスが終了することはありません.
この問題を解決するための回避策はありますか?
java - Jaunt Element が機能しないのを見つけましたか?
YouTube から特定の要素 (ビデオのタイトル) を取得しようとしています。
HTML: http://pastebin.com/cjr2SgNd
重要な HTML 部分:
私はこれを見つけたい:title="Latest Agar.io PvP - Create Your Own Server!"
ただし、次のエラーが表示されます: http://pastebin.com/G7x9FZaa
Jaunt を使用してタイトルを取得しています。コード: