2 行以上の空白行が新しいデータ セクションを表す .csv ファイルがあります。しかし、アプリオリに、各セクションに何行あるかはわかりません。pandas データ フレームを直接読み取り、最初の 2 行以上の空白行で停止する方法はありますか?
データは次のとおりです (Google トレンドの結果からの .csv ファイル。ここでは省略されています)。
Web Search interest: zts
Worldwide; 2004 - present
Interest over time
Week,zts
2004-01-04 - 2004-01-10,0
2004-01-11 - 2004-01-17,80
Top regions for zts
Region,zts
Slovakia,100
Slovenia,23
Top cities for zts
City,zts
Bratislava (Slovakia),100
Wroclaw (Poland),39
Top searches for zts
focus zts,100
ford zts,90
Rising searches for zts
2002 focus zts,Breakout
battery tester,Breakout
ここでcsv.reader()
、すべての行を使用してループし、最初の列の日付正規表現に一致し、2 つの列を持つ行を保持します。しかし、これはハックのようです。
次のようなものを使用するとpandas.read_csv(input_file, header=4)
(後で日付正規表現を使用して正しいセクションを見つけます)、最後のセクションに3つの列があると失敗します(ここではそうではありませんが、可能です)。
行数を事前に知らpandas.read_csv()
なくても、最初のブロックの後に停止する方法はありますか? 理想的には、この .csv を 5 つのデータ フレーム (データ セクションごとに 1 つ) に解析したいと考えていますが、この時点では最初のセクションを取得できて満足しています。