問題タブ [robobrowser]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PythonでRequestsライブラリを使用してスクレイピングするときのセッションの管理
ページをスクレイピングしているときに、新しいセッションの作成と維持に問題があります。Requests ライブラリを使用してスクリプト内でセッションを開始し、値を Web フォームに解析しています。ただし、「セッションがタイムアウトしました」ページが返されます。
ここに私の情報源があります:
検索したいURLはこれhttps://www.searchiqs.com/NYALB/SearchAdvancedMP.aspx
「アンドリュー」というパーティ1の名前を探しています。この検索ボックスを保持するフォーム要素が「Rctl00$ContentPlaceHolder1$txtName」であることを確認しました。アクション URL は SearchResultsMP.aspx です。
ブラウザから実行すると、結果の最初のページが表示されます。ターミナルでそれを行うと、セッションの期限切れページが表示されます。何か案は?
python - ログインが成功したかどうかを知る方法は?
私は roboBrowser を使用してウェブサイトにログインしていますが、これはコードです
ここで、フォームが正常に送信されたことがわかります.requests.getのように成功として応答コードを返さないため、ログインが成功したこと<Response 200>
をどのように知ることができますか?しかし、この場合、何も返されません。ログインが成功したかどうか。
python - 指定したテキスト文字列のコメントを見つけるにはどうすればよいですか
いくつかの html コンテンツを解析するために robobrowser を使用しています。中に BeautifulSoup があります。指定した文字列が内部にあるコメントを見つけるにはどうすればよいですか
実際、ANY_ID を知っている場合は TEXT_1 を取得する必要があります ありがとう
python - 特定の親を持つ要素を見つける方法は?
次のような HTML があります。
親として cl1 を持つ cl2 クラスのアイテムを見つける必要があるため、text_1ではなくtext_2を取得する必要があります。単純な css では、次のようになります。
しかし、私はrobobrowserとBeautifulSoupを使用し、試してみると
cssセレクターが間違っていると言われています。
python-2.7 - ログイン後にrobobrowserがページソースを返さないのはなぜですか?
robobrowser を使用して Web サイトでのログイン プロセスを自動化しようとしています。コードは次のとおりです。
現在、ログイン フォームは、Firefox のデバッグで見られるように、次の入力を受け取ります。
__EVENTTARGET、__EVENTARGUMENT、__VIEWSTATE、__VIEWSTATEGENERATOR、__EVENTVALIDATION、ユーザー名、パスワード、btnlogin、txtUsername、txtemailid、
__VIEWSTATEGENERATOR 、 __EVENTVALIDATION 、 __VIEWSTATE の値は変更されません。
コードはログインページの HTML を返しますが、ログイン後のページの HTML が必要です。
ログインページの HTML は次のとおりです。
python-2.7 - ラジオボタンをクリックするpython RoboBrowser
しばらくの間、以下のコードを修正しようとしましたが、何らかの理由で、ラジオボタンをクリックする必要がある部分を除いてコードのすべての部分が機能し、「ValueError: Option 1 not found in field」と表示されますが、 1 のオプションで、0 または 1 のいずれかです。以前は機械化で遊んでいました。自分が何をしているのかはほとんどわかっていますが、誰か助けてもらえますか? お願い&ありがとう
python - ログイン付きのロボブラウザスクレイプページ.
ページをスクレイピングしようとしていますが、何らかの理由でログインページにアクセスできません。アイデアが不足しているので、助けていただければ幸いです...
エラーは発生しません。他のpythonライブラリを使ったソリューションも受け付けています!
python - Python robobrowser get_form がフォーム全体を取得していません
robobrowser を使用して、Web サイトでの検索を自動化しています。2 つのフォーム入力を入力する必要がありますが、robobrowser.get_form は最初の入力しか取得していません。完全なフォームを取得し、2 番目の入力に値を割り当てる方法についてのアイデアはありますか?
HTML:
Python スクリプト: