ffdf
package からオブジェクトとして保存した大規模なデータセットに対してクラスタリングを実行しようとしていますffbase
。ffbase
(useR!2013 カンファレンスのメモ) のドキュメントによると、パッケージstream
はこれを行うためのサポートを提供します。
の関数を見てきましたが、ストリームとしてstream
設定する方法がわかりません。ffdf
私が考えることができる唯一の機能は、機能DSD_Wrapper
しません。私は使用する必要があると思いDSD_ReadStream
ますが、それを機能させる方法がわかりません。
ここにmweがあります:
library(ffbase)
library(stream)
ffmt <- as.ffdf(mtcars)
dsmt <- DSD_Wrapper(mtcars) #works fine
dsff <- DSD_Wrapper(ffmt) #does not work
構造を調査すると、それは非常に単純なオブジェクトであることがわかり、手動で再作成できましたが、実際のデータのサイズがこれを妨げています。