python - Dask エラー: 値の長さがインデックスの長さと一致しません

Question

この方法でdaskを使用してcsvファイルを読みました：

import dask.dataframe  as dd
train = dd.read_csv('act_train.csv')

次に、行ごとに単純なロジックを適用したいと思います。これは、パンダではかなりうまく機能します。

columns = list(train.columns)

for col in columns[1:]:
    train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])

残念ながら、コードの最後の行で次のエラーが生成されます:値の長さがインデックスの長さと一致しません

私は何を間違っていますか？

score 0 · Accepted Answer

x にスペース文字が含まれていない場合、 x.split(' ') は単一の要素 x を含むリストを返します。

そのため、x.split(' ')[1] を呼び出して x.split(' ') の 2 番目の要素にアクセスしようとしている場合。エラーが発生します：

x.split(' ') のインデックス 1 に要素がないため、「値の長さがインデックスの長さと一致しません」。

1 に答える 1