python - Pandas head コマンドで期待どおりの結果が得られない

Question

パンダの機能を動作させることができません。簡単な例を次に示します。次のコマンドを使用して、データフレームに kaggle データセットを読み込みます。

import pandas as pd
train_data=pd.read_csv('kaggle_train.csv',header=None)

次に、head コマンドを使用して最初の 5 つのデータ行を要求します。

train_data.head()

データの最初の 5 行を取得する代わりに、次の出力を取得します。

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns:
X0     5  non-null values
X1     5  non-null values
X2     5  non-null values
X3     5  non-null values
X4     5  non-null values
X5     5  non-null values
X6     5  non-null values
X7     5  non-null values
X8     5  non-null values
X9     5  non-null values
X10    5  non-null values
X11    5  non-null values
X12    5  non-null values
X13    5  non-null values
X14    5  non-null values
X15    5  non-null values
X16    5  non-null values
X17    5  non-null values
X18    5  non-null values
X19    5  non-null values
X20    5  non-null values
X21    5  non-null values
X22    5  non-null values
X23    5  non-null values
X24    5  non-null values
X25    5  non-null values
X26    5  non-null values
X27    5  non-null values
X28    5  non-null values
X29    5  non-null values
X30    5  non-null values
X31    5  non-null values
X32    5  non-null values
X33    5  non-null values
X34    5  non-null values
X35    5  non-null values
X36    5  non-null values
X37    5  non-null values
X38    5  non-null values
X39    5  non-null values
X40    5  non-null values
dtypes: float64(40), int64(1)

なぜこれが起こっているのか誰でも説明できますか？

Windows Vista Home Premium Service Pack 2 を実行している HP Pavilion ラップトップの IPython ウィンドウバージョン 0.13.1-1 で Python 2.7.3 を実行しています。

score 2 · Accepted Answer

デフォルトでは、読みやすい方法で表示するには列が多すぎる場合、pandas は出力の要約形式を表示します。を実行して実際のデータを表示するように強制できprint train_data.head().to_string()ますが、列が非常に多いため、出力が読みにくい場合があります。

score 2 · Accepted Answer

他の回答で述べたように、これは DataFrame の概要ビューです (表示するには列が多すぎるためです*)。iloc/; を使用して、最初の行と列を確認できます。

In [11]: df = pd.DataFrame(np.random.randn(100,100))

In [12]: df.iloc[:3, :4]  # first 3 rows and 4 columns
Out[12]: 
          0         1         2         3
0  1.271254 -1.057603  0.411799  0.523563
1  0.828735  0.306329  0.508435 -1.214766
2  0.684236 -1.541779  2.354181 -1.036631

*デフォルトではこれは 20 ですが、オプションで変更できます (列数よりも多くすることができます):

pd.options.display.max_columns = 101

df.head()「期待どおり」にすべての行が表示されるようになりました。

前述のように、0.13 では、この動作はデフォルトでより多くのフレーム (最初のmax_columns列まで)を表示するように変更されています。

In [21]: pd.options.display.max_columns = 5  # by default this is 20

In [22]: df.head()
Out[22]: 
          0         1         2         3         4    
0 -0.269232  0.059875  1.420564  2.106847  1.999374 ...
1 -0.625981 -0.459105 -0.818499 -0.375799  2.619382 ...
2 -1.027394 -0.084883  0.294238  0.636856 -0.356340 ...
3  1.735632  0.235712 -0.283334 -0.191722 -0.885285 ...
4 -0.154700  1.640423  1.021390  0.636728  0.918846 ...

[5 rows x 100 columns]

python - Pandas head コマンドで期待どおりの結果が得られない

2 に答える 2

Related

Reference