2

私はRにかなり慣れていないので、何か間違ったことを述べている場合は事前に謝罪してください:)

多くの企業で、395 行と 4973 列で構成されるデータフレームがあり、月ごとに並べ替えられ、1 か月あたりの発生数 (0 から 25 の範囲) があります。発生数は、月別、年別の日別データからまとめました。私のデータフレーム df は次のようになります (数か月と 3 社のみ):

Date     FirmA FirmB FirmC
01-2015  20    NA    20
02-2015  21    2     1
03-2015  22    3     2
04-2015  24    7     5
05-2015  10    10    10
06-2015  9     20    2
07-2015  13    22    1
08-2015  20    19    1

ここで、会社ごとの発生数を t-3 から t-1 (前の 3 か月) までの 3 か月のローリング ウィンドウで合計するタスクがあります。ただし、合計には以下の条件が必要です。3 か月の期間中に少なくとも 10 回、月 t-1 に少なくとも 3 回発生する必要があります。2 つの条件が満たされている限り、NA が t-3 および/または t-2 にあるかどうかは問題ではありません。

そのように見えるはずです。

Date     FirmA FirmB FirmC
01-2015  NA    NA    NA
02-2015  20    NA    20
03-2015  41    NA    NA
04-2015  63    NA    NA
05-2015  67    12    NA
06-2015  56    20    17
07-2015  43    37    NA
08-2015  32    52    NA

特にローリングウィンドウ/合計(おそらくラグのあるもの)の組み合わせと、使用する数値と使用しない数値に関する条件については、私には手がかりがありません。

4

2 に答える 2