私が Dask Dataframes で抱えている問題はほとんどありません。
2列のデータフレームがあるとしましょう['a','b']
新しい列が必要な場合c = a + b
パンダで私はするだろう:
df['c'] = df['a'] + df['b']
ダスクでは、次のように同じ操作を行っています。
df = df.assign(c=(df.a + df.b).compute())
パンダで行うのと同じように、この操作をより良い方法で書くことは可能ですか?
2 番目の質問は、私をさらに悩ませているものです。
パンダ'a'
で行 2 & 6の値を に変更したい場合np.pi
は、次のようにします。
df.loc[[2,6],'a'] = np.pi
Daskで同様の操作を行う方法を理解できませんでした。私のロジックはいくつかの行を選択し、それらの行の値のみを変更したいと考えています。