フラットファイルの形式で一定のデータストリームを読み取るRscriptがあります。別のスクリプトがこのフラット ファイルを取得し、解析と処理を行ってから、結果を RDS 形式の data.frame として保存します。その後スリープし、プロセスを繰り返します。
saveRDS(tmp.df, file="H:/Documents/tweet.df.rds") #saving the data.frame
2 回目... n 回目の繰り返しでは、前の繰り返し以降にフラット ファイルに追加された新しい行のみをコードで処理します。ただし、デルタ ラインを永続的なデータ フレームに追加するには、それを読み込んで追加し、保存して元のデータを上書きする必要があります。
df2 <- readRDS("H:/Documents/tweet.df.rds") #read in permanent
tmp.df2 <- rbind(df2, tmp.df) #append new to existing
saveRDS(tmp.df2, file="H:/Documents/tweet.df.rds") #save it
rm(df2) #housecleaning
rm(tmp.df2) #housecleaning
RDS が読み取り/書き込み用に開かれているときはいつでも、そのファイルにアクセスしようとする別のプロセスが待機する必要があるため、このアプローチは危険です。ベース ファイルが大きくなるにつれて、リスクが高まります。
完全な置換ではなく追加を使用して、ファイルに保存された単一のデータフレームの反復更新を実現できるようなものはありappendRDS
ますか?