この方法で Excel シートを pandas DataFrame に読み込みます。
import pandas as pd
xl = pd.ExcelFile("Path + filename")
df = xl.parse("Sheet1")
各列の最初のセルの値が dataFrame の列名として選択されています。独自の列名を指定したいのですが、どうすればよいですか?
この場合、後でそれらを設定することが唯一の方法だと思います。たとえば、DataFrame に 4 つの列がある場合:
df.columns = ['W','X','Y','Z']
Excelfile のどのヘッダーがおそらく名前を変更した方がよいかを事前に知っている場合は、W を A などに名前変更します。
df.rename(columns={'W':'A', 'X':'B', etc})
キーワード引数.parse
で呼び出します。header=None
df = xl.parse("Sheet1", header=None)