質問を説明しましょう:
私は関数を知っているtable
かxtabs
、分割表を計算しますが、常に RAM に格納される data.frame を期待しています。これを大きなファイル (たとえば、20 GB、私が取り組まなければならない最大値) で実行しようとすると、非常に苦痛になります。
一方、SAS はファイルを 1 行ずつ読み取り、その過程で結果を更新するため、これを完全に実行できます。したがって、RAM には常に 1 行しかないため、はるかに許容されます。
私は、SAS で行う方法がわからなかったり、面倒すぎると思ったりする、より複雑なことをしなければならなかったときに、アドホックな Python プログラムで SAS と同じことをしたことがあります。Python の構文と統合された機能 (辞書、正規表現など) は、その弱点を補っています (主に速度ですが、20 GB を読み取る場合、いずれにしても速度はハード ドライブによって制限されます)。
私の質問: R でこれを行うためのパッケージがあるかどうか知りたいです。Python で行うようにファイルを 1 行ずつ読み取ることができることは知っていますが、単純な統計 (たとえば、分割表) を大きなファイルは非常に基本的なタスクであるため、統計パッケージでそれを行うには多かれ少なかれ「統合された」機能が必要だと思います。
この質問を「Cross Validated」で行うべきかどうか教えてください。統計よりもソフトウェアに関するものなので、疑問がありました。