13

私は Web アプリケーションを開発しており、2 種類の統計/モデリング操作を実行したいと考えています。

(1) アプリのバックエンド (HBase クラスター) に保存されているデータからのバッチ分析。通常、この操作は定期的に、たとえば毎晩実行する必要があります。データのサイズがローカル メモリに格納できるサイズを超える可能性があるため、並列計算をサポートするパッケージの呼び出しが必要になる場合があります。(2) フロントエンドでのユーザー要求によってトリガーされるオンザフライ R 実行。典型的なユースケースには、小さな時系列の予測が含まれます。ユーザーは同時にリクエストを送信する可能性があるため、同時実行をサポートする必要があります。ユーザーは応答が来るのを無期限に待つことはできないため、パフォーマンスは最も重要です。

私の質問は、これら 2 つの問題に対処するためのテクノロジと CRAN パッケージの最適な組み合わせは何でしょうか? 現時点での私の考えは次のとおりです。

  • Rserver を Ruby クライアントと組み合わせて使用​​する。あるいは、Java でサーバーを作成し、既存の R/Java バインディングを使用することを考えています。
  • RHadoop を使用して大きなデータセットのジョブを処理する。

RevoDeployR は優れたツールですが、オープン ソースではありませんね。

ご協力ありがとうございました

4

3 に答える 3

5

RApache(http://rapache.net /)をRパッケージRJSONIOまたはrjsonと一緒に使用することをお勧めします

于 2012-10-22T10:05:58.150 に答える
4

Rook パッケージを見てください。任意の R セッションを Web サーバーに変えることができます。これは非常に単純で、実際、Rapache で使用されています。

編集

私の最初の答え以来、私はshinyを使い始めました。これは、動的で複雑な AJAX 駆動型の Web ページを高レベルの R インターフェイスで作成するための優れたパッケージであり、HTML をまったく、またはほとんどまったく使用する必要はありません。

于 2012-10-22T10:10:39.850 に答える