問題タブ [jaunt-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1437 参照

java - java および jaunt-api を使用して Web ページにログインする際の問題

Jaunt を使用して Web ページにログインしようとしています。最初に言及することは、Web ページが .aspx で、送信ボタンにオプションがあるonclick="javascript:WebForm_DoP..."ことです。私の知る限り、Jaunt は Javascript をサポートしていませんよね? 私が間違っている場合に備えて、私が使用しているコードは Jaunt の例のものです。

Web ブラウザーを使用してログインできるため、すべての名前と値が正しく、ユーザーとパスワードが機能します。コードを実行すると、出力に次のように表示されます。

メッセージ: UserAgent.sendPOST; Connection error requestUrl: http://webpagehere.com/default.aspx [posting __VIEWSTATE=%2FwEPDwUJLTk5MDc0NjQ2ZBgBBR5fX0NvbnRyb2xzUmVxdWlyZVBvc3RCYWNrS2V5X18WAgURTG9naW4xJFJlbWVtYmVyTWUFF0xvZ2luMSRMb2dpbkltYWdlQnV0dG9upWcarODJIwpeMt8HCmfaBn6iMWI%3D&__VIEWSTATEGENERATOR=CA0B0334&Login1%24UserName=USER&Login1%24Password=PASSWORD&Login1%24LoginButton=GO] response: [none]

フォーム div は次のとおりです。

私の問題は何ですか?Jaunt でこのログインが許可されない場合、誰かが Web スクレイピングとインタラクション用のライブラリを勧めてくれませんか? ありがとう!

0 投票する
1 に答える
590 参照

java - Jaunt-api Cookie の問題

jaunt-api を使用して yahoo メールにログインしようとしていますが、「cookie が有効になっていない問題」が発生します。私はjaunt-apiが初めてなので、助けてください。次のコードを使用しています。

0 投票する
1 に答える
717 参照

html - Jaunt - 特定の要素があるかどうかを確認します

Nutch を使用して Web サイトをクロールし、現在プラグインを作成しています。Jaunt 1.0.0.1 は、HTML の解析に使用されます。たとえば、私は行を持っています

ページ上が no の場合、エラーが発生します<div class=info_books_item>。現在、Jaunt JavaDocs を見ていますが、そのような要素があるかどうかを確認する方法がわかりません。

0 投票する
1 に答える
1028 参照

java - Jaunt webcrawler - Google 検索結果の次のページにアクセスできない

最初のページだけでなく、Google からより多くの検索結果を返したい。したがって、2 番目for-loopは基本的に次のページの結果を返す必要がありますが、そうではありません。理由はありますか?

0 投票する
2 に答える
1289 参照

java - Java と Jaunt API を使用して、複雑な名前 (入力タグにドット表記) を含む HTML フォームに入力する

- 皆さん、

私は Java ツールを構築しており、inputJava とJaunt API.

HTML コードは次のようになります。

「通常の」入力フィールドに入力するための Java コードreference(動作します) は次のようになります。

残念ながら、searchprofile.surname名前にドット表記を使用するフィールドに入力することはできません

これが私が試したもののサンプルです(成功せずに):

これらのコマンドごとに NotFoundException が発生し、Jaunt でこれを実行できるかどうかわかりません。

この点に関して、あらゆる種類の助けをいただければ幸いです。

前もって感謝します

編集 - searchprofile.surnameJSoup でドット表記の入力フィールドに到達する方法はありますか?

HTML はname-Attribute でドットを使用できますが、Jaunt はこれを受け入れますabc.nameか?

0 投票する
1 に答える
124 参照

java - Jsoup パーサーによる HTML データ抽出

次の HTML から、指定された形式でデータを抽出する最良の方法は何ですか。

期待される出力:

ITEM_NAME : ティーカサラダ

ITEM_DESCRIPTION : ケール、ヒマワリの芽、キノア、アボカド、グレープ トマト、アルファルファもやし、ニンジン、キュウリのドレッシング。

ITEM_PRICE: $9.95

ITEM_IMG : /yelp_images/s3-media4.fl.yelpcdn.com/bphoto/1P50jjYUA4ofx5hF85wm5Q/ms.jpg

Jsoup と Jaunt を使用してさまざまな方法を試しました。まだそれを理解することができません。

0 投票する
1 に答える
126 参照

web-scraping - Jaunt Webcrawler API が相対 URL を正しく処理しない

次のようなクローラーを実装します。

クロールしているページは

https://www.mercadoribeirao.com.br

次のようなすべてのリンクを取得しています:

最初のページでは、次のようにリンクを正しく取得します。

しかし、サブページにアクセスすると、URL が正しく連結されません。

おそらく、ベースページではなく、URL の最後にリンクを連結するために、相対リンクを自動的に完成させようとするためです。

作成されたこれらの新しいリンクは何らかの理由で正しいものであり、常に新しいリンクにアクセスする必要があり、これは無期限に発生し、プロセスが終了することはありません.

この問題を解決するための回避策はありますか?

0 投票する
0 に答える
472 参照

java - Jaunt Element が機能しないのを見つけましたか?

YouTube から特定の要素 (ビデオのタイトル) を取得しようとしています。

HTML: http://pastebin.com/cjr2SgNd

重要な HTML 部分:

私はこれを見つけたい:title="Latest Agar.io PvP - Create Your Own Server!"

ただし、次のエラーが表示されます: http://pastebin.com/G7x9FZaa

Jaunt を使用してタイトルを取得しています。コード: