35

Python のデータフレームに Excel データをインポートする方法を教えてください。

基本的に、現在の Excel ワークブックは、開くときにいくつかの vba を実行して、ピボット テーブルを更新し、その他の処理を行います。

次に、ピボット テーブルの更新の結果を Python のデータフレームにインポートして、さらに分析したいと考えています。

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

#sheetnames
print wb.sheet_names()

#number of sheets
print wb.nsheets

ファイルの更新と開きは正常に機能します。しかし、ヘッダーを含む5行目から最後のレコードnまでの最初のシートからデータを選択するにはどうすればよいですか。

4

2 に答える 2

52

pandas の ExcelFileparseメソッドを使用して Excel シートを読み取ることができます。io docsを参照してください。

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows最初の 4 行 (つまり、行インデックス 4 から開始) と、その他のいくつかのオプションを無視します。

于 2013-07-09T13:02:34.043 に答える
24

受け入れられた回答は古いです(受け入れられた回答のコメントで説明されているように)。現在、推奨されるオプションはpd.read_excel()を使用することです。例えば:

df = pandas.read_excel('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm'), skiprows=[0,1,2,3,4])
于 2017-04-28T18:01:50.430 に答える