26

グラフのような構造を永続化するための現在の最良の選択は何ですか?グラフデータベース(例:Neo4j)またはRDFトリプルストア(例:Virtuoso)?

たとえば、次のユースケースがあります。

  • 1000万近くのノードを持つ弱連結グラフ(コレクション内の学術論文のグラフに類似)。
  • 非常にまれな更新。
  • 重要な操作:特定のサブグラフの取得、特定のサブグラフ内のノードの更新、一部のノードの更新後のリンク分析測定値(HITSやPageRankなど)の再計算。

サードパーティアプリケーション(FacebookまたはTwitter)のデータをクエリするための標準APIを提供することも望まれます。

4

2 に答える 2

11

Virtuosoを使用すると、次のことが可能になります。

--SPARQL、SQL、SPASQL(SQL内のSPARQL)、およびSPARQLサポート内のSQL(たとえば、魔法/関数の述語/プロパティを介したN-ary関係の処理用)。

--170億トリプル以上のライブLODクラウドキャッシュまたはより小さなDBpediaライブインスタンスを介して示されるように、コンパクトなエンジン(たとえば、KDEデスクトップを介して利用される)または大規模なDBMSとして機能します。

--SPARQLのフルテキストインデックスとテキストパターンが含まれています(bif:containsを介して)XPath / Xqueryも含まれています(xcontainsを介して)

-酸性または非酸性モード同上スキーマ-プロパティグラフストアを処理するときの最後

--Transformation Middlewareを介して、80以上のデータソース(REST API、SOAPサービス、Hypermediaリソース、ODBCまたはJDBCアクセス可能なリレーショナルデータソースなどを含む)からデータをプルし、一時的または永続的なリンクデータグラフに変換できます。

--リンクトデータの公開は自動的に行われます。つまり、DBMSレコードの作成後、DBMSへのビューとしてリンクトデータページが組み込まれています。reをいじりません。URL-書き換えルール、303リダイレクトなど。InterWebスケールのスーパーキーが機能します!

今のところ以上です:-)

于 2011-02-11T22:11:12.490 に答える
8

水平スケール(したがって、小規模から中規模のデータベース)の場合、neo4jのようなグラフデータベースは現在、グラフトラバーサルのパフォーマンスを向上させます。しかし、トリプルストアは追いついてきています。グラフデータベースと比較したトリプルストアの大きな利点は、データダンプとクエリ言語が標準化されていることです。つまり、別の製品への移行がはるかに簡単で、ベンダーロックインを防ぐことができます。

于 2011-03-09T10:00:21.007 に答える