r - RでのFFパッケージによる大容量CSVの基礎解析

翻译自：https://stackoverflow.com/questions/16778389 2013-05-27T18:04:22.457

279 次

私は昨年Rをいじっていましたが、今はもう少し深くなりたいと思っています。一部のドキュメントを理解するのに苦労しているため、ffおよびパッケージについて詳しく知りたいです。big data

私は実際にやってみるのが好きなので、data.csv という巨大な CSV とその 300 mbs があるとします。Url、PR、つぶやき、いいね、年齢の 5 つのヘッダーがあります。URL に基づいてリストの重複を排除したい。次に、PR といいねを散布図にプロットして、相関関係があるかどうかを確認します。その基本的な分析を行うにはどうすればよいでしょうか。

ビッグデータプロセスのチャンク化と、一度にすべてをロードできない方法について、私はいつも混乱します。

ff パッケージまたはビッグデータを使用して遭遇した一般的な問題は何ですか? よりうまく機能する別のパッケージはありますか？

基本的に、R で大量のデータを使い始めるための情報は役に立ちます。

ありがとう！

ニコ

r - RでのFFパッケージによる大容量CSVの基礎解析

0 に答える 0

Related

Reference