0

Python モジュール blaze を使用しようとしています。小さなデータセットで使用すると機能します。より大規模で複雑なデータセットに移動すると、エラーが発生します。以下に例を示します。エラーを考えると、ブレイズが最初の列を日付に変換するのに問題があるようです。Blaze が解析しようとしないように、特定の列の dtype を文字列として指定するにはどうすればよいですか。ありがとう。

In [2]:
from pandas import *
from pylab import *
import pandas as pd
import pylab as plt
import numpy as np
import csv
import statsmodels.api as sm
import matplotlib
%matplotlib inline
import timeit
import blaze as bz
from blaze import *
bz.__version__
Out[2]:
'0.6.5'

In [3]:
t = Table('C:/Users/CRSP 1991 Current.csv')

In [4]:
t.columns
Out[4]:
[u'PERMNO',
 u'date',
 u'SICCD',
 u'PERMCO',
 u'PRC',
 u'RET',
 u'SHROUT',
 u'vwretd',
 u'ewretd']

In [5]:
t
C:\Users\Anaconda\lib\site-packages\IPython\core\formatters.py:239: FormatterWarning: Exception in text/html formatter: Unable to parse "12/31/1991" as a date
  FormatterWarning,
Out[5]:
<repr(<blaze.api.table.Table at 0x186bd3c8>) failed: ValueError: Unable to parse "12/31/1991" as a date>

In [6]:
t_smaller = t.PERMNO
t_smaller
Out[6]:
PERMNO
0   10001
1   10001
2   10001
3   10001
4   10001
5   10001
6   10001
7   10001
8   10001
9   10001
10  10001

In [7]:
t_smaller_10001 = t_smaller[t_smaller == 10001]
t_smaller_10001

Out[7]:
<repr(<blaze.expr.table.Column at 0x18819048>) failed: ValueError: Unable to parse "12/31/1991" as a date>
4

1 に答える 1

1

これは最近のバージョンで処理されていると思います。conda経由でBlazeを更新してみてください

conda install blaze -c blaze

メインの anaconda チャネルは比較的頻繁に更新されません。blaze チャンネル (これはその-c blaze一部です) は毎週更新されます。

于 2014-12-11T17:57:21.900 に答える