1

この方法でdaskを使用してcsvファイルを読みました:

import dask.dataframe  as dd
train = dd.read_csv('act_train.csv')

次に、行ごとに単純なロジックを適用したいと思います。これは、パンダではかなりうまく機能します。

columns = list(train.columns)

for col in columns[1:]:
    train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])

残念ながら、コードの最後の行で次のエラーが生成されます:値の長さがインデックスの長さと一致しません

私は何を間違っていますか?

4

1 に答える 1

0

x にスペース文字が含まれていない場合、 x.split(' ') は単一の要素 x を含むリストを返します。

そのため、x.split(' ')[1] を呼び出して x.split(' ') の 2 番目の要素にアクセスしようとしている場合。エラーが発生します:

x.split(' ') のインデックス 1 に要素がないため、「値の長さがインデックスの長さと一致しません」。

于 2016-08-08T13:30:30.400 に答える