行の長さを事前に知らなくても、ファイルread_csv
の最初の行だけを読み取る組み込みの方法はありますか? n
読み取りに時間がかかる大きなファイルがあり、最初の 20 行だけを使用してサンプルを取得したい場合があります (完全なものをロードして先頭を取得したくない場合もあります)。
行の総数がわかっている場合は、次のようにして、これをキーワード argfooter_lines = total_lines - n
に渡すことができます。skipfooter
私の現在の解決策は、python で最初の行を手動で取得しn
、StringIO で pandas に渡すことです。
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
それほど悪くはありませんが、キーワードなどを使用して、より簡潔で「パンダシック」(?) な方法はありますか?