0

過去の株価などの時系列データは通常、RDBMS に格納されます。

私は、このデータを使用するためのさまざまなオプションを評価しており、MarkLogic のドキュメント ストアまたはトリプル ストアに格納する可能性があります。また、このデータおよび/またはドキュメント/トリプル ストアに格納されている他の種類のデータと共にいくつかのユース ケースを構築しています。

本質的に、私は

  1. 過去の株価などの時系列データを MarkLogic データベースに保存します。
  2. XQuery などを使用して、このデータ (ML に格納されているか、RDBMS でクエリを実行) をクエリする方法。
  3. doc/triple ストアに格納されている他のデータとともに、このデータをクエリする方法。

この点に関する推奨事項をいただければ幸いです。


さらに情報を追加しました...

このデータをトリプルとしてキャプチャするきちんとした方法を見つけようとしています。このデータを他の関連データとリンクさせるといいだろうという考えです。たとえば、格納しようとしている過去の株価が NYSE に上場している HSBC のものである場合、何らかの方法で HSBC と NYSE のリソースを定義し、株価をリテラルとして (おそらく) キャプチャしてから、リソース HSBC をたとえば、dbpediaに格納されている会社情報です。

基本的に、リンクされたデータを作成することについて話しているので、さまざまなソースからフェッチされたデータ間で簡単にクエリを実行したり、可能であれば推論を使用したりできます。たとえば、このアプローチを使用すると、「ロンドンに本社があり、売上高が 10 億ドルを超える企業の株価を取得する」などのクエリを実行できます。

4

2 に答える 2

0

時系列データを時系列データベースに保存することをお勧めします: https://en.wikipedia.org/wiki/Time_series_database

更新 1 :

HSBC をエンティティとして定義し、場所や人数などのエンティティのメタデータを指定してから、四半期ごとの収益と取引ティック価格を個別の時系列として保存できます。次に、a) Location などのメタデータ タグでフィルター処理し、MAX(price) などの集計でフィルター処理するクエリを実行できます。実際には、人数もシリーズとして保存します。このようにして、調査と分析のために異なるシリーズ間の相関関係を調査できます。

于 2015-08-17T20:46:54.913 に答える