7

私はこの質問への答えを見ました: YYYYMMDD と HH が Pythonで pandas を使用して別々の列にある場合の日付を解析しますが、うまくいかないようで、何か微妙に間違っていると思います。

pandas read_csv 関数を使用して読み取ろうとしている .csv ファイルにデータがあります。日付と時刻は 2 つの別々の列にありますが、datetime オブジェクトを含む 1 つの列 "Datetime" に結合したいと考えています。csv は次のようになります。

    Note about the data
    blank line
    Site Id,Date,Time,WTEQ.I-1...
    2069, 2008-01-19, 06:00, -99.9...
    2069, 2008-01-19, 07:00, -99.9...
    ...

このコード行を使用してそれを読み取ろうとしています:

   read_csv("2069_ALL_YEAR=2008.csv", skiprows=2, parse_dates={"Datetime" : [1,2]}, date_parser=True, na_values=["-99.9"])

ただし、csv に書き戻すと、まったく同じに見えます (na_values 引数で指定したように、-99.9s が NA に変更されることを除いて)。日付と時刻は 2 つの別々の列にあります。私が理解しているように、これは、date_parser を使用して解析された列 1 と 2 で構成される Datetime という新しい列を作成する必要があります。parse_dates={"Datetime" : ["Date","Time"]}、parse_dates=[[1,2]]、および parse_dates=[["Date", "Time"]] も使用してみました。また、date_parser=parse を使用してみました。ここで、parse は次のように定義されています。

    parse = lambda x: datetime.strptime(x, '%Y-%m-%d %H:%M')

これらのどれも少しも違いを生んでいないので、もっと深刻な問題があるのではないかと思います. それが何であるかについての洞察はありますか?

4

1 に答える 1