0

私はさまざまな種類の金融時系列のコレクションを持っています。私の分析のほとんどは列または行指向であり、複雑なクエリを実行する必要があることはほとんどありません。また、私は(今では)ほぼすべての分析を R で行っています。

このため、私は RDBMS を一切展開せず、代わりに R で直接データを管理する (RDS ファイルを保存する) ことを真剣に検討しています。これにより、DB を管理するためにインストールする手間が省け、おそらくデータの読み込み速度が向上します。

それ以外に考慮すべき理由はありますか?この方法でデータを管理している人を知っていますか? これが漠然としていることは承知していますが、回答ではなく意見を求めています。

4

3 に答える 3

1

R での作業が快適なゾーンである場合は、分析や実行が長くなっても、データ管理を R に任せたいと思います。

私は最近、同様の決定を下しました:

  1. 実行時間を数ミリ秒短縮するために、新しい(言語/方言/システム)を学習して適用する方向に進むべきですか。

    また...

  2. たとえ実行時の速度が遅くなったとしても、私が使用していたのと同じ古いツールを使用する必要がありますか?

あなたのランニングの成果はあなただけのものですか?もしそうなら、私は R のみでのデータ管理に固執します.. 本番環境の実行が遅くなっても。

銀行、携帯電話サービス、または同様のトランザクション環境用に何かを設計している場合は、優れたソリューションを見つけることをお勧めします。

しかし、あなたのRプロダクションがあなたのためなら..私はRにとどまります.

于 2012-07-28T20:36:59.330 に答える
1

機会費用を考えてみましょう。新しい言語/エコシステム (PostgreSQL のようなものは確かに資格があります) を学ぶことは、あなたが思っているよりもはるかに多くの時間を吸収します。これらのスキルは価​​値があるかもしれませんが、既存の分析に費やした追加の時間から得られるリターンと同じくらい高い、投資した時間に対するリターンを生み出すでしょうか?

それが個人的な使用であり、差し迫ったパフォーマンスの問題がない場合は、R を使用してください。一般に、本格的な DB よりもテキスト ファイルや RDS ファイルの方がばかげたことを行う方が簡単であることを考えると、すべてをバックアップするようにしてください。私はクラウドベースのストレージに非常に懐疑的でしたが、過去半年で大きな転換を遂げ、最も機密性の高い情報を除いてすべてそこに保存されるようになりました。私は Dropbox を使用しています。これは、ひどい失敗をした場合でも、以前のバージョンのデータを維持します。

角にあるカフェの資料や台本をスマホでチェックできるのもいいですね。

于 2012-07-30T00:19:06.350 に答える
0

colbycol大規模なデータセットに DB のような機能を提供するように設計された CRAN には、列ごとの管理パッケージがあります。著者も同様の分析を行ったに違いないと思います。

于 2012-12-01T03:48:30.650 に答える