この方法でdaskを使用してcsvファイルを読みました:
import dask.dataframe as dd
train = dd.read_csv('act_train.csv')
次に、行ごとに単純なロジックを適用したいと思います。これは、パンダではかなりうまく機能します。
columns = list(train.columns)
for col in columns[1:]:
train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])
残念ながら、コードの最後の行で次のエラーが生成されます:値の長さがインデックスの長さと一致しません
私は何を間違っていますか?