3

これは典型的な SO の質問ではないかもしれないという事実を十分に認識していますが、これは私が知っている最強の R プログラミング コミュニティであり、opencpu の作成者はここに投稿することを明示的に推奨しているため、試してみます。

このアプローチでデータはどのような役割を果たしopencpuますか? つまり、クラウド コンピューティングは優れていますが、計算するにはデータが必要です。サンプルの .csv または .xls テーブルをアップロードするのは簡単かもしれませんが、実際のデータに対して opencpu は何を考えているのでしょうか?

数百 MB (または GB) のデータはどうでしょうか? どのように a) ユーザー フォルダに転送しますか? どのように b) 認証されたユーザーのグループ間で共有し、c) 一般に公開されないようにしますか?

ライセンスの部分を読みましたが、安全のために理解していることから、ソースコードが公開されている限り、舞台裏で計算を実行できるはずです。それでも、この小さな文書には未解決の問題と多くの推測が残されています。

4

3 に答える 3

2

OpenCPU をお試しいただきありがとうございます。OpenCPU は現時点ではまだ発展途上のプロジェクトであるため、興味深い提案や使用例を歓迎します。

データについて...一度に多くのことを尋ねています。いくつかの考え:

  • 現時点では、OpenCPU は「ビッグデータ」の問題を解決していません。R 自体のスケーリングを超えてスケ​​ーリングすることはありません。これは主に、小規模から中規模のデータのインフラストラクチャとして意図されています。たとえば、典型的な研究論文、プロジェクトなど。
  • OpenCPU は API です。ブラウザ クライアントに限定されません。他のクライアントからも呼び出されるように設計されています。
  • OpenCPU には、R オブジェクトをサーバーに格納するために使用するストアがあります。たとえば、CSV などを一度アップロードしてから、実際のデータフレームを保存します。その後の呼び出しでは、このオブジェクトを関数呼び出しの引数として含めることができます。
  • 別のアプローチは、それを外部データベース (例: mysql) と組み合わせて、R コードでデータを動的にプルすることです (例: RMySQL を使用)。
  • 確かに、オープン データの法的側面は、現時点では完全には明らかではありません。著作権がデータにどのように適用されるか、および適切なライセンスとは何かについて、コンセンサスがあるとは思いません。ただし、OpenCPU の設計における重要な機能は、物事を簡単に再現できるようにすることです。もちろん、これはデータが実際に公開されている場合にのみ実行できます。
于 2012-06-22T20:15:24.080 に答える
0

opencpu のローカル インスタンスをインストールできます。インターネット上の既存のものを使用する必要はありません。手順はサイトにあります。

于 2012-06-21T23:27:55.853 に答える