1

パンダでこの.txt ファイルを読み込もうとしていますが、これが私の結果です。私は(素朴に)昨夜このことをこつこつと思っていましたが、どうやら間違っているようです。単純に実行すると

rebull = pd.read_table('rebull.txt',sep=' ')

それは機能しますが、最初の.txt RESULTの分離から推測するNaNの無秩序な配列で結果が得られます

4

2 に答える 2

2

skipinitialspace を試してください:

In [26]: pd.read_table('test.txt', sep=' ', skipinitialspace=True)
Out[26]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385 
Data columns (total 7 columns):
Mon          386  non-null values
id           386  non-null values
NA           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_K8     386  non-null values
class.1      0  non-null values
dtypes: float64(3), object(4)

編集

問題を誤解して申し訳ありません。@DSMが述べたようにテーブルを読んで、列名も設定できると思います

In [55]: pd.read_table('test.txt', sep=r"\s\s+", header=None, skiprows=[0], names=['Mon id', 'Na', 'alpha_K24', 'class', 'alpha_8', 'class'])
Out[55]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 6 columns):
Mon id       386  non-null values
Na           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_8      386  non-null values
class        386  non-null values
dtypes: float64(2), object(4)

class秒を別の名前として設定する場合があることに注意してください。または、2つの列を取得しますdf['class']

于 2013-05-17T02:35:10.670 に答える
0

私の問題を理解しました...必要に応じて、インデックスがハイフンで結合されていることを常に確認してください。特に、最初の列の「Mon ID」が問題でした...「Mon-id」である必要があります。

于 2013-05-16T20:04:42.373 に答える