私はPythonアプリケーションを持っています。これには、Web スクレーパーによって Web から取得された、発生したことに関するデータでいっぱいの SQLite データベースがあります。このデータには、時間と日付のグループが Unix タイムスタンプとして含まれており、それらのために予約された列に含まれています。あることを行った組織の名前を取得し、その頻度を数えたいのですが、データを持っている週ごと (つまり 604,800 秒) についてこれを行います。
擬似コード:
for each 604800-second increment in time:
select count(time), org from table group by org
基本的に、私がやろうとしているのは、時間列で並べ替えられたリストのようにデータベースを反復処理することです。ステップ値は 604800 です。目的は、全体のさまざまな組織の分布が時間の経過とともにどのように変化したかを分析することです。
可能であれば、データベースからすべての行を引き出して Python で処理することは避けたいと思います。これは、a) 非効率的であり、b) データがデータベースにあることを考えるとおそらく無意味です。