7

パンダを指定すると、次のdf方法で何かを行う前にコピーできます。

df.copy()

daskデータフレームオブジェクトでこれを行うにはどうすればよいですか?

4

4 に答える 4

9

dask.dataframe オブジェクトのミューテーションはまれであるため、これが必要になることはめったにありません。

そうは言っても、オブジェクトを安全にコピーできます

from copy import copy
df2 = copy(df)

dask.dataframe 操作はデータフレームのフィールドを変更しないため、これで十分です。

于 2016-08-03T12:14:31.467 に答える
0

データの 2 つのバージョンが必要になる場合があります。1 つは変更後のバージョンです。copy使用できる dask データフレームのメソッドがあります。python と同じように動作する可能性がありますが、copy.copy(私にとっては) ライブラリ管理者のバージョンを使用する方が安全だと思われる場合。

import dask.dataframe as dd
ddf = dd.from_pandas(pd.DataFrame({'z': [1, 2]}), npartitions=1)
ddf2 = ddf.copy()
ddf2['z'] -= 10

print(ddf.compute())
print()
print(ddf2.compute())
   z
0  1
1  2

   z
0 -9
1 -8
于 2021-04-11T01:19:27.833 に答える
-3

ファイルに書き込み、再度読み取ります。

import os
import dask.dataframe as dd

df = <Initial Dask Dataframe to be copied>
file = 'sample.csv'
df.to_csv(file)
df2 = df.read_csv(file)
os.remove(file)
于 2016-08-03T12:21:48.230 に答える