Pandas を使用して、シリーズをリアルタイムで操作したいと考えています。毎秒、最新の観察結果を既存のシリーズに追加する必要があります。私のシリーズは DataFrame にグループ化され、HDF5 ファイルに保存されます。
現時点で私がそれを行う方法は次のとおりです。
>> existing_series = Series([7,13,97], [0,1,2])
>> updated_series = existing_series.append( Series([111], [3]) )
これが最も効率的な方法ですか?数え切れないほどの投稿を読みましたが、高頻度データの効率性に焦点を当てたものは見つかりません。
編集:モジュールのシェルフとピクルについて読んだところです。基本的にリストをディスクに保存するという、私がやろうとしていることを彼らが達成するようです。リストが大きいため、完全なリストをメモリにロードせずに、一度に 1 つずつ効率的に値を追加する方法はありますか?