SQL -> .csv データ ダンプ フラット ファイルを企業ごとの時系列に変換しようとしています。
私にとって重要なのは、データが 4 四半期の年次タプルに編成されていることです。四半期末日は、各会社の最初のタプルで指定される会計四半期です。データを暦四半期の時系列に変更する必要がありますが、その方法がわかりません。
これらのデータ ラベルから日時インデックスを作成するにはどうすればよいですか?
各会社には常に同じ数のタプルがありますが、null 値が含まれる場合があります。以下のデータフレーム行の例では、会計年度の終了日が異なる 2 つの企業が強調表示されています。
eps_tuples[300:400]
Name Ticker Field Year Qtr 1 Qtr 2 Qtr 3 Qtr 4 FY
953 Accuray Inc ARAY EPS Year Sep.30 Dec.31 Mar.31 Jun.30 Full Year
943 Accuray Inc ARAY EPS 2012 -0.38 -0.15 -0.21 -0.28 -1.02
944 Accuray Inc ARAY EPS 2013 -0.31 -0.35 -0.42 -0.25 -1.33
945 Accuray Inc ARAY EPS 2014 -0.21 -0.07 -0.06 -0.13 -0.47
946 Accuray Inc ARAY EPS 2015 -0.27 -0.13 -0.04 -0.07 -0.51
947 Accuray Inc ARAY EPS 2016 -0.12
960 Accuride Corp ACW EPS Year Mar.31 Jun.30 Sep.30 Dec.31 Full Year
961 Accuride Corp ACW EPS 2012 -0.06 -0.02 -0.37 -0.47 -0.92
962 Accuride Corp ACW EPS 2013 -0.31 -0.11 -0.18 0.04 -0.56
963 Accuride Corp ACW EPS 2014 -0.07 0.11 0.02 -0.10 -0.04
964 Accuride Corp ACW EPS 2015 -0.01 0.13 0.04 -0.05 0.11
965 Accuride Corp ACW EPS 2016 0.02 0.11 0.04
四半期ごとの日付ラベルだけを取得するために df をスライスすることから始めました
eps_tuples[eps_tuples['FY']=='Full Year'][42:47]
Name Ticker Field Year Qtr 1 Qtr 2 Qtr 3 Qtr 4 FY
906 ACCO Brands ACCO EPS Year Mar.31 Jun.30 Sep.30 Dec.31 Full Year
924 Accretive Healt ACHI EPS Year Mar.31 Jun.30 Sep.30 Dec.31 Full Year
942 Accuray Inc ARAY EPS Year Sep.30 Dec.31 Mar.31 Jun.30 Full Year
960 Accuride Corp ACW EPS Year Mar.31 Jun.30 Sep.30 Dec.31 Full Year
978 ACE Limited ACE EPS Year Mar.31 Jun.30 Sep.30 Dec.31 Full Year
次に、通常、パンダの日付範囲を次のようにします
rng=pd.date_range(end='2016-12-31',freq='Q',periods=20)
最大20の期間があり、場合によってはそれ以下であり、開始と終了は最初のタプルによって動的に定義され、タプルが暦年である場合に想定されるようにタプル内の位置に関連付けられていないため、私は困惑しています.
どのように進めればよいですか?