最新の状況に基づいて現在の状況を調べようとしました。
次のデータフレームがあるとします(実データの略)
examineData
ID Date Status_Value
A 2012-01-01 100
A 2012-01-10 200
A 2012-02-20 500
B 2012-01-01 1100
B 2012-01-10 1200
B 2012-02-20 1500
C 2012-01-01 2100
C 2012-01-10 2200
C 2012-02-20 2500
上記では、A、B、C は status_value を持つオブジェクトです。Status_values は日付で検査されました。
asked
ID Date
A 2012-01-09
A 2012-02-28
B 2012-02-19
C 2012-01-10
しかし、誰かが特定の日付に A、B、C のステータスについて尋ねました (それよりも少ない可能性があります)。
ご覧のとおり、 の一部は とasked$Date
一致しませんexaminData$Date
。
その場合、 から最新のデータを取得することにしましたexamineData$Date
。
ID Date Status_Value
A 2012-01-09 100
A 2012-02-28 500
B 2012-02-19 1200
C 2012-01-10 2200
サンプルコードを教えてください。(速度が重要 - の 1,600,000 行examineData
、 の 110,000 行asked
)
また、IDの種類は60,000種類以上あります。また、examineData で同じ ID に重複する日付はありません。