0

これはファイルの内容です(sample.txtという名前)

gvkeyx        from        thru    conm                gvkey     co_conm                      co_tic
123453    19661214    19890426    S&P 500 Comp-Ltd    010490    TEXAS EASTERN CORP           PEL4    
123453    19670101           .    S&P 500 Comp-Ltd    001078    ABBOTT LABORATORIES          ABT     
123453    19670101           .    S&P 500 Comp-Ltd    001300    HONEYWELL INTERNATIONAL INC  HON     
123453    19670101           .    S&P 500 Comp-Ltd    001356    ALCOA INC                    AA      
123453    19670101           .    S&P 500 Comp-Ltd    001408    FORTUNE BRANDS INC           FO 

それを読むために入力したコード:

In [16]: colspecs = [(0, 9), (10, 21), (22, 33), (34, 53), (54, 63), (64, 92), (93, 99)]

In [17]: df = read_fwf('sample.txt', colspecs = colspecs, header=None, index_col=None)

In [18]: df[:2]

Out[19]:      
<class 'pandas.core.frame.DataFrame'>
Int64Index: 2 entries, 0 to 1
Data Columns:
X.1    2    non-null values
X.2    2    non-null values
X.3    2    non-null values
X.4    2    non-null values
X.5    2    non-null values
X.6    2    non-null values
X.7    2    non-null values
dtypes: object(7)

この出力がファイルとはまったく異なるものとして理解するのに苦労しています。コメントやアドバイスがあれば役に立ちます。ありがとう

4

1 に答える 1

3

参照: http://pandas.pydata.org/pandas-docs/stable/dsintro.html#console-display

データが端末に対して広すぎるため、要約を出力します。これは で設定できますpandas.set_printoptions。ほぼ確実に指定する必要があるためheader=0(これがデフォルトだと思います)、df = read_fwf('sample.txt', colspecs=colspecs)十分なはずです。

于 2012-05-18T18:42:10.230 に答える