パンダを指定すると、次のdf
方法で何かを行う前にコピーできます。
df.copy()
daskデータフレームオブジェクトでこれを行うにはどうすればよいですか?
dask.dataframe オブジェクトのミューテーションはまれであるため、これが必要になることはめったにありません。
そうは言っても、オブジェクトを安全にコピーできます
from copy import copy
df2 = copy(df)
dask.dataframe 操作はデータフレームのフィールドを変更しないため、これで十分です。
データの 2 つのバージョンが必要になる場合があります。1 つは変更後のバージョンです。copy
使用できる dask データフレームのメソッドがあります。python と同じように動作する可能性がありますが、copy.copy
(私にとっては) ライブラリ管理者のバージョンを使用する方が安全だと思われる場合。
import dask.dataframe as dd
ddf = dd.from_pandas(pd.DataFrame({'z': [1, 2]}), npartitions=1)
ddf2 = ddf.copy()
ddf2['z'] -= 10
print(ddf.compute())
print()
print(ddf2.compute())
z
0 1
1 2
z
0 -9
1 -8
ファイルに書き込み、再度読み取ります。
import os
import dask.dataframe as dd
df = <Initial Dask Dataframe to be copied>
file = 'sample.csv'
df.to_csv(file)
df2 = df.read_csv(file)
os.remove(file)