問題タブ [rselenium]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ループが失敗した場合にソースを実行する (RSelenium)
一連のリンクをチェックしてスクリーンショットを撮るループを作成しました。多くの場合、これらを数千単位で行う必要があります。私が作成したループは、約 500 個のリンクに対して適切に機能し、ブラウザが閉じて、次のエラーが表示されます。
これを防ぐ方法はありますか?
そうでない場合、これが発生した場合、R にソース コード OpenBrowser.R を実行させるにはどうすればよいですか?
スクリプトは次のとおりです。
r - RSelenium が DOM にアクセスできない
Stockpair Web サイトで Selenium を使用しています
エラーが発生します
DOMが非同期処理で変更された場合に発生することを調査しました。ただし、chrome.exeを表示して実行しているSeleniumでテストしましたが、DOMは変更されず、ページをロードした後も要素が残っています。
他に原因はありますか?
r - RSelenium を使用して Web ページ テーブルからデータを取得する
RSelenium を使用して、この National River Flow Archive (UK) Web サイト ( http://nrfa.ceh.ac.uk/data/station/info/69032 ) から年間最大流量データを収集しようとしています。ドロップダウン メニューをネゴシエートする方法が見つかりません。現在、次を使用してプロセスを半自動化できます。
これはちょっとしたハックであり、RSelenium でクリックするのではなく、ページ上のいくつかのボタンをクリックする必要があります。RSelenium が [ピーク フロー データ] タブを選択し、ドロップダウン メニューから [最大年間 (AMAX) データ] オプションを選択する方法について何か提案はありますか?
javascript - rでphantomjsを使用して複数のページをスクレイピングできません
RSelenium によって制御される phantomjs を使用して、 https: //www.washoecounty.us/assessor/cama/?command=assessment_data&parid=07101001から javascript を使用して生成された複数の区画の歴史的な資産価値に関する郡査定人データをスクレイピングしようとしています。URL の「paraid」は 9 桁のパーセル番号です。興味のある区画番号のリスト (合計で数百) を含むデータフレームがありますが、それらの小さなサブセットでコードを機能させようとしています:
各区画のページで生成されたテーブルのデータをスクレイピングして保存する必要があります。ページをファイル「output.htm」に書き込み、その後ファイルを解析することにしました。私のコードは次のとおりです。
これは、ループの 1 回または 2 回の反復では完全に機能しますが、JavaScript によって生成されたデータの保持が突然停止し、エラーが発生します。
これは、テーブルが保持されていないため、パーサーが出力ファイル内のテーブルを見つけられないことが原因です。私が選択した実装に問題があるのか、それとも問題の原因となっている特定のサイトの特異性があるのかはわかりません。私は JavaScript に詳しくないので、使用されているコード スニペットは私が見つけた例から取られています。ご協力ありがとうございます。
以下の答えは完全に機能しました。また、Sys.sleep(5) を $navigate の後に移動して、ページ時間が JavaScript をロードできるようにしました。ループは完了まで実行されています。
r - RSeleniumでダウンロードフォルダを指定
RSelenium
ファイルをダウンロードするためのボタンを含む Web ページに移動するために使用しています。RSelenium を使用して、ファイルをダウンロードするこのボタンをクリックします。ただし、ファイルはデフォルトで「ダウンロード」フォルダーにダウンロードされますが、ファイルを作業ディレクトリにダウンロードしたいと考えています。以下のようにクロムプロファイルを指定しようとしましたが、これはうまくいかなかったようです:
ファイルは、作業ディレクトリではなく、「ダウンロード」フォルダーにダウンロードされたままです。これはどのように解決できますか?