0

パンダを使用して csv ファイルをチャンクで読み取ろうとしていますが、列のサブセットのみを取得したいと考えています。私は使用しようとしています

df = pandas.io.parsers.read_table(myData, chunksize=1000)
df = df[id_fields + [time_field] + value_fields]

しかし、それは私に次のエラーを与えます:

TextFileReader' object has no attribute '__getitem__'

チャンクサイズ ビットを削除すると、同じコードが機能します。

df = pandas.io.parsers.read_table(myData)
df = df[id_fields + [time_field] + value_fields]

これを回避する方法はありますか?

ありがとう、アン

4

1 に答える 1

0

必ずしも最も賢い解決策ではありませんが (たとえば、ほとんどのチャンクが役に立たない場合)、次のようにしてください。

it = pandas.read_table(myData, chunksize=1000)
df = pandas.concat([chunk[id_fields + [time_field] + value_fields]
                    for chunk in it])
于 2016-01-28T09:57:29.587 に答える