次のようなグラフがあります。
Source | Sink | Timestamp
A B 2012-08-01 03:02:00
B C 2012-08-01 03:02:00
C D 2012-08-01 03:02:00
...
このテーブルを別のテーブルから作成しています。次のようにテーブルを設計したいと思います。
- 最新のグラフを取得できることを考慮せずに、最小限のストレージを使用します (リアルタイムのシナリオでは、以前のグラフは気にしません)。
- グラフの進化を調べることができるはずです(何かがどれだけ速く変化するかなど)
現在、 と a を格納する以外にSource
、Sink
他Timestamp
の最適化はありません。すべてのスナップショットに 800K リンクが含まれていることを考慮すると、グラフ全体を保存することはできないため、可能なdelta
ベースのアプローチを探しています。この問題にアプローチする方法について何か提案はありますか?
グラフ自体は非常に動的です。つまり、各スナップショットでノードとリンクを追加または削除できます。