1

次の形式のスペースで区切られたCSVファイルがあります。

2012-11-01 1 2012-12-01 4 2013-02-01 6
2012-12-01 2 2013-01-01 nan
2012-11-01 3 2012-12-01 5 2013-01-01 5 2013-04-01 7

基本的に日付の後に値が続きますが、日付はまばらです。一部の値はnanであるか、欠落している可能性があります。これをパンダに読み込んで、対応する日付に基づいて値を並べられるようにしたいと思います。

実行中のパンダ:

import pandas as pd
pd.read_csv('sparse.csv', sep=" ", parse_dates=True)

エラー:

ValueError: Expecting 6 columns, got 8 in row 1

このファイルを読み取り、日付/値を揃える方法は何でしょうか?

(多分私ができる「前処理」はありますか?)

ありがとう

4

1 に答える 1

2

CSVには、同じ数のフィールドを持つ行が含まれている必要があります。ペア間の関係のない日付番号のペアだけの場合、CSVではなく、ペアのファイルだけです。したがって、ペアのファイルとして解析する必要があります。

input = open("sparse.csv").read().split() # split by newlines and spaces
i = iter(input)
for date in i:
    if date != "nan":
        value = i.next()
        # process pairs
于 2012-11-08T15:00:01.273 に答える