問題タブ [rselenium]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RSelenium - phantom.js でファイルをダウンロードする
I can download a file from a webpage from a connection using RSelenium
a Firefox browser via a connection with the Firefox browser with the following formula:
phantomjs ブラウザーでプロセスを複製しようとしても、何も起こりません。ダウンロードディレクトリが設定されていない可能性があると推測して、試しました:
それでも何も起こりません。これを機能させるために何が必要かを考えてくれてありがとう。
編集。
ページ接続または要素の選択を停止するようには見えませんが、セットアップ中に次のレポートを追加する必要があります。これは関連する場合と関連しない場合があります。
r - [名前を付けて保存] ダイアログをナビゲートするための AutoIt および RSelenium (Firefox)
以下のコードを機能させるために、数日(数週間ではないにしても...)試しています。私が達成しようとしているのは、R スクリプトが毎日実行されることです (バッチ スクリプトと Windows Server 2008 64 ビットの Windows タスク スケジューラを介して)。その R スクリプトは、特定の Web サイトに移動し、ログインして [名前を付けて保存] ダイアログを呼び出し、完全なページを特定のパスに保存します。
RStudio 内の自分のマシン (Win 8 - 64 ビット) でスクリプトを実行すると、リモートで、Rscript.exe を介して動作しません。
問題は SaveAs.au3 スクリプトにあるようです - RStudio 経由またはファイル エクスプローラーから呼び出すと、完全に動作します。バッチ ファイル内で実行される同じ R スクリプト:
system() コマンドまで動作し、エラーや警告を表示せずにクラッシュします。
たぶん、同じような問題を抱えていて、助けてくれる人がいますか?ありがとう!
3 つの AutoIt スクリプトは次のとおりです。
SaveAs.au3 / exe
EditName.au3は、R 内から可変的に書き込まれ、呼び出されます。
KeyEnter.aut3
R スクリプトは次のようになります。
r - Rvest と phantomJS を使用して HolidayIQ からすべてのホテルのレビューをスクレイピングする方法
R の Rvest パッケージを使用して、このホテルのメイン ページからすべてのユーザー レビューをスクレイピングしたいと考えています。
最初の 10 件のレビューしか取得できません。JavaScript によって生成される [もっと見る] ボタンをクリックすると、次の一連のレビューが読み込まれます。
私は次の JavaScript を書きました - 「basic.js」:
次に、Rで次のコマンドを使用しました:
出力された「taj.html」ファイルには、すべてのレビューが含まれているわけではありません。それで、スクレイプコード...
... 最初の 10 件のレビューのみを返します。
r - RSelenium - テーブル (および非テーブル) からのデータの抽出
今日、Web サイトからデータをスクレイピングするために RSelenium を初めて使用しました。タブとドロップダウン メニューを使用して必要なデータに移動できますが (難しいですか?)、必要な実際のデータを抽出する段階で行き詰まります (簡単な問題です!)。
これまでの私のコードは次のとおりです。
このプレーヤーテーブルのデータをcsv形式に抽出する最も簡単な方法を教えてください。XML パッケージと readHTMLTable を使用して他の (静的) Web サイトをスクレイピングすることに慣れていますが、これを上記の RSelenium の手順と組み合わせる方法に行き詰まっています。
ありがとうございました
編集 - 新鮮な目でこれに戻ってきたので、私が見つけた答えは以下のとおりです。
これにより、Web サイトのこの部分で必要なことを進めることができます。
よろしければ、同じサイトの別の部分についてお尋ねしたいと思います。次のように、必要なデータに移動します。
抽出したいデータはこれらのボックスにありますが、HTML にはテーブルとして構築されているとは書かれていないので、どのように処理すればよいかわかりません。
loops - RSelenium: ドロップボックス内のすべての値をループします
このリンクを使用して、各国の HIV/AIDS 関連のすべての NGO の表をかき集めようとしています: https://www.unodc.org/ngo/showExtendedSearch.do
URL に移動して、[HIV/AIDS] ラジオ ボタンを選択できます。しかし今、ドロップボックスの「地域」と「国」の両方ですべての値を抽出して、それらをループ内で使用して、各国のテーブルを順番に Web スクレイピングする必要もあります。両方のドロップボックスの値を収集するにはどうすればよいですか? これまでの私のコードは次のとおりです。
r - RSelenium は、R の Firefox プロファイルに拡張機能を追加します
拡張機能を追加する rselenium に Firefox プロファイルを追加しようとしています。これが私がこれまでに思いついたものです:
エラーは発生しませんが、プラグインをインストールまたはロードせずに Firefox が開きます。プラグインをFirefoxに正しく追加するにはどうすればよいですか?
xpath - セカンドの選び方Xpathを使用する要素
このWeb ページから完全なレビューを収集しようとしています。(完全なレビュー - [もっと読む] ボタンをクリックした後)。これは RSelenium を使用して行っています。<p>
コードを使用して、最初の要素からテキストを選択して抽出できます
これは、テキストのレビューを減らすためのものです。
ただし、コードを使用して全文レビューを抽出することはできません
また
空のリスト要素を示しています。何が悪いのかわかりません。私を助けてください..