400列のcsvファイルがあるとします。ファイル全体をDataFrameにロードできません(メモリに収まりません)。ただし、実際には50列しか必要ないので、これはメモリに収まります。これを行うための組み込みのPandasの方法は見当たりません。何を指示してるんですか?私はPyTables
インターフェースを使用することにオープンです、またはpandas.io.sql
。
最良のシナリオは、次のような関数になります pandas.read_csv(...., columns=['name', 'age',...,'income'])
。つまり、ロードされる列名(または番号)のリストを渡します。