ffdfpackage からオブジェクトとして保存した大規模なデータセットに対してクラスタリングを実行しようとしていますffbase。ffbase(useR!2013 カンファレンスのメモ) のドキュメントによると、パッケージstreamはこれを行うためのサポートを提供します。
の関数を見てきましたが、ストリームとしてstream設定する方法がわかりません。ffdf私が考えることができる唯一の機能は、機能DSD_Wrapperしません。私は使用する必要があると思いDSD_ReadStreamますが、それを機能させる方法がわかりません。
ここにmweがあります:
library(ffbase)
library(stream)
ffmt <- as.ffdf(mtcars)
dsmt <- DSD_Wrapper(mtcars) #works fine
dsff <- DSD_Wrapper(ffmt) #does not work
構造を調査すると、それは非常に単純なオブジェクトであることがわかり、手動で再作成できましたが、実際のデータのサイズがこれを妨げています。