私はこの素晴らしいツールの学習を始めています。いくつかの時系列をロードし、それらを「マスター」日付ベクトルに合わせるという単純なタスクに行き詰まっています。
例: 私は csv ファイルを持っています: Data.csv の最初の行には、"Date1, Rate1, Date2, Rate2"
Date1 が Rate1 の日付で、Date2 が Rate2 の日付であるヘッダーが含まれています。
この場合、Rate2 にはより多くの観測値があり (開始日は Date1 と同じですが、終了日は Date1 の終了日よりも離れており、欠損値が少ない)、Date2 に従ってすべてのインデックスを作成する必要があります。
次の DataFrame を取得するための推奨される方法は何ですか? (または同様のことを達成する)
index(Date2) Rate1 Rate2
11/12/06 1.5 1.8
12/12/06 NaN 1.9
13/12/06 1.6 1.9
etc
etc
11/10/06 NaN 1.2
12/10/06 NaN 1.1
13/10/06 NaN 1.3
公式の pandas.pdf と Google の例に従おうとしましたが、役に立ちませんでした。(私はMcKinney氏のパンダブックのプレエディションも購入しましたが、パンダに関する章はまだ準備ができていません:( )
これの素敵なレシピはありますか?
どうもありがとうございました
編集:シリーズを2つの.CSVファイルに分割するという答えについて:しかし、非常に多くの時系列がある場合、たとえば
Date1 Rate1 Date2 Rate2 ... DateN RateN
そして、私が知っているのは、欠損値を含むシリーズからの例外を除いて、日付はほぼ同じでなければならないということです(日付またはレートのエントリがない場合)(ちなみに、これは金融経済学の時系列の例です)
このデータセットを読み込んで、すべてのシリーズを個別の .CSV に分割する方法をお勧めしますか?
EDIT2 archlightは完全に正しいです。「csv_read」を実行するだけで問題が発生します。
基本的に、私の質問は次のように要約されます。各シリーズに日付列とシリーズ自体の列がある、整列されていない複数の時系列を結合する方法 (Excel からエクスポートされた .CSV ファイル)
再度、感謝します