3

私は昨年Rをいじっていましたが、今はもう少し深くなりたいと思っています。一部のドキュメントを理解するのに苦労しているため、ffおよびパッケージについて詳しく知りたいです。big data

私は実際にやってみるのが好きなので、data.csv という巨大な CSV とその 300 mbs があるとします。Url、PR、つぶやき、いいね、年齢の 5 つのヘッダーがあります。URL に基づいてリストの重複を排除したい。次に、PR といいねを散布図にプロットして、相関関係があるかどうかを確認します。その基本的な分析を行うにはどうすればよいでしょうか。

ビッグ データ プロセスのチャンク化と、一度にすべてをロードできない方法について、私はいつも混乱します。

ff パッケージまたはビッグデータを使用して遭遇した一般的な問題は何ですか? よりうまく機能する別のパッケージはありますか?

基本的に、R で大量のデータを使い始めるための情報は役に立ちます。

ありがとう!

ニコ

4

0 に答える 0