4

Web サイトで AJAX/Javascript によって制御される情報を取得するために、R スクリプトを介してブラウザー (できれば Firefox) を制御する方法を見つけようとしています。たとえば、http://www.mobile.de/home/index.htmlの「Model」フィールドの値を取得するにはどうすればよいでしょうか?

知る限り、Gabe Becker のパッケージ「RFirefox」は、R と Firefox の間のある種のリンクを提供します。しかし、Windows-Kid (信念によるものではなく、長年のネットワーク効果;-)) であるため、まだ自分で試すことができなかったので、自分が求めていることができるかどうかはわかりません.

RFirefox または R 経由で AJAX を処理した経験のある人はいますか? 宿題をしてほしくないのですが、Linux の世界に飛び込む前に、それだけの価値があるかどうかを評価したいと思います。

それにもかかわらず、コード例は大歓迎です。;-)

4

1 に答える 1

3

これを行うためにブラウザが必要な理由がわかりません。これは単なる Web スクレイピングです。確かにある種のパーサーが必要ですが、必ずしもブラウザーが必要というわけではありません。RFirefox が間違ったツリーを鳴らしている可能性があると思います。Javascript+R 接続を試してみたい場合は、Duncan Temple Lang のSpiderMonkeyを参照してください。

とはいえ、Javascript に適した本格的なクロール/スクレイピング機能でデータを収集した方がよいのではないかと思います。 SOに関するこの質問は、特にそれと一致しているようです。私が推奨するのは、必要なことを実行するツールを入手し、それを可能な限り単純なレベルで R と連携させることです。Webkit にはいくつかの言語へのバインディングがありますが、これは R には当てはまらないようです。

この質問は、あなたの状況をさらに詳しく扱っています.Windowsでも同様です。Webkit は使用しません。受け入れられた回答の 3 つの提案は、C/C++ で記述された Python からのツールへのアクセスに関するものです。R には両方のインターフェイスがあるため、これらを操作するための何かを記述して、R と Python または C/C++ の間でオブジェクトと命令をやり取りする方が簡単な場合があります。

于 2011-10-26T16:03:17.487 に答える