python - データフレームのサブセットを TextParser オブジェクトとして取得します

Question

パンダを使用して csv ファイルをチャンクで読み取ろうとしていますが、列のサブセットのみを取得したいと考えています。私は使用しようとしています

df = pandas.io.parsers.read_table(myData, chunksize=1000)
df = df[id_fields + [time_field] + value_fields]

しかし、それは私に次のエラーを与えます:

TextFileReader' object has no attribute '__getitem__'

チャンクサイズビットを削除すると、同じコードが機能します。

df = pandas.io.parsers.read_table(myData)
df = df[id_fields + [time_field] + value_fields]

これを回避する方法はありますか？

ありがとう、アン

score 0 · Accepted Answer

必ずしも最も賢い解決策ではありませんが (たとえば、ほとんどのチャンクが役に立たない場合)、次のようにしてください。

it = pandas.read_table(myData, chunksize=1000)
df = pandas.concat([chunk[id_fields + [time_field] + value_fields]
                    for chunk in it])

python - データフレームのサブセットを TextParser オブジェクトとして取得します

1 に答える 1

Related

Reference