私はこれを、R
私が使用していたパッケージに固有のものではなく、についての一般的な/初心者の質問として尋ねています。
私はdataframe
300万行15列のを持っています。私はこれを巨大なデータフレームとは考えていませんが、おそらく私は間違っています。
私は次のスクリプトを実行していて、それは2時間以上実行されています-これをスピードアップするために私ができることがあるに違いないと思います。
コード:
ddply(orders, .(ClientID), NumOrders=len(OrderID))
これは過度に集中的なスクリプトではありません。また、そうではないと思います。
データベースでは、テーブルにインデックスを追加して、結合速度を上げることができます。R
関数/パッケージをより高速に実行するためにインポートで実行する必要がある同様のアクションはありますか?