2.6GBのcsvファイルがあるため、パンダの代わりにdaskを使用しようとしています。ロードして、列を削除したい。しかし、ドロップメソッド df.drop('column') もスライス df[ : , :-1] もないようです
まだ実装されています。これは事実ですか、それとも何かが足りないのですか?
2.6GBのcsvファイルがあるため、パンダの代わりにdaskを使用しようとしています。ロードして、列を削除したい。しかし、ドロップメソッド df.drop('column') もスライス df[ : , :-1] もないようです
まだ実装されています。これは事実ですか、それとも何かが足りないのですか?
この PRdrop
でメソッドを実装しました。これは dask 0.7.0 以降で利用可能です。
In [1]: import pandas as pd
In [2]: df = pd.DataFrame({'x': [1, 2, 3], 'y': [3, 2, 1]})
In [3]: import dask.dataframe as dd
In [4]: ddf = dd.from_pandas(df, npartitions=2)
In [5]: ddf.drop('y', axis=1).compute()
Out[5]:
x
0 1
1 2
2 3
以前は、列名でスライスを使用することもできました。もちろん、多くの列がある場合、これはあまり魅力的ではありません。
In [6]: ddf[['x']].compute()
Out[6]:
x
0 1
1 2
2 3