1

このタブ区切りファイルをパンダに読み込もうとしていますが、最後の列(平均)は、科学的記数法の値を表す文字列からnumpy.float64に変換する必要があります。

これまでに試しました

df = pd.DataFrame(pd.io.parsers.read_table(fle, converters={'mean': lambda x: np.float64(x)}))

しかし、私がdf ['mean']で取得するのは0、と-0です。

convertersまた、 kwargなしでインポートし、後で実行して列をキャストしようとしましたがdf['mean'].astype(np.float64)、同様の結果が得られました。

何が得られますか?

4

2 に答える 2

3

それらはゼロではありません。pandasおそらく、印刷中に何らかの書式設定を行うため、ゼロのDataFrame/Seriesように見えます。

ちなみに、コンバーターは必要ありません。read_tableそれらを正しく識別しますfloat64

In [117]: df = pandas.read_table('gradStat_mmn.tdf')

In [118]: df.ix[0:10]
Out[118]:
    Subject Group Local Global  Attn  mean
0         1  DSub     S      S  Attn     0
1         1  DSub     S      S  Dist     0
2         1  DSub     D      S  Attn     0
3         1  DSub     D      S  Dist     0
4         1  DSub     S      D  Attn     0
5         1  DSub     S      D  Dist     0
6         1  DSub     D      D  Attn     0
7         1  DSub     D      D  Dist     0
8         2  ASub     S      S  Attn     0
9         2  ASub     S      S  Dist     0
10        2  ASub     D      S  Attn     0

In [119]: df['mean'].dtype
Out[119]: dtype('float64')

In [120]: df['mean'][0]
Out[120]: 3.2529000000000002e-22
于 2012-09-14T02:40:04.937 に答える
2

これは、パンダのバージョン0.9で修正されています。

In [4]: df = pandas.read_table('http://dl.dropbox.com/u/6160029/gradStat_mmn.tdf')

In [5]: df.head()
Out[5]: 
   Subject Group Local Global  Attn          mean
0        1  DSub     S      S  Attn  3.252900e-22
1        1  DSub     S      S  Dist  6.010100e-22
2        1  DSub     D      S  Attn  4.215700e-22
3        1  DSub     D      S  Dist  8.308100e-22
4        1  DSub     S      D  Attn  2.983500e-22
于 2012-09-20T14:19:21.153 に答える