14

異種 (複数のノード タイプ (マルチモード)、複数のエッジ タイプ (マルチリレーション)、および複数の記述機能 (マルチ機能)) ネットワークのネットワーク分析用のインフラストラクチャを探していると、2 つの標準スタックがあることに気付きました。グラフ データベースの世界:

一方で、ThinkPop/Blueprint プロパティ グラフ モデルがあります。Neo4jOrientDB GraphDBDexTitanInfiniteGraphなどでサポートされています。

Tinkerpop スタックには、Blueprintプロパティ グラフ モデル インターフェイス、Gremlinグラフ トラバーサル言語、Furnaceグラフ アルゴリズム パッケージが含まれています。

一方、 W3Cの Linked Data テクノロジー スタックは、 AllegroGraph4storeOracle Database Semantic TechnologiesOWLIMSYSTap BigDataなどでサポートされています。

セマンティック データはRDF / RDFS / OWLを使用して表現され、 SPARQLを使用してクエリを実行できます。さらに、ルール推論機能を提供します。

ここで、グラフデータベースで異種データを表現し、そのようなデータ(統計、関係発見、構造、進化など)を分析したいとします(これらの用語は広範で曖昧であることは知っています)-それぞれの相対的な強みは何ですかさまざまなタイプのネットワーク分析タスクのモデル? これら 2 つのモデルは互いに補完し合っていますか?

4

1 に答える 1

7

リンクされたデータ スタックの例はすべてトリプル ストアです。最初にトリプル ストアをセットアップしてリンクト データ アプリケーションの構築を開始しますが、データベースをリンクト データ スタックと呼ぶのは正しくありません。これもトリプル ストアの不完全なリストです。SesameJenaMulgaraStardogもあります。. Sesame と Jena は二重の役割を果たします。これらはセマンティック Web の 2 つのデファクト スタンダード Java API ですが、どちらも API にバンドルされたトリプル ストアを提供します。また、Cray と IBM の両方がトリプル ストアに取り組んでいることも知っていますが、現時点ではどちらについてもあまり知りません。Stardog が TinkerPop スタックでうまく機能すること、そして基本的には RDF に対する Gremlin クエリを書き始めるだけであることは知っています。

RDF/OWL の強みは、1) 真のクエリ言語を取得できること、2) それらは w3c標準であること、3) トリプル ストアがそれをサポートしている場合、推論を無料で取得できることです (多かれ少なかれ、まだオントロジーを書くこと)。

RDF/OWL/SPARQL が標準であるため、必要に応じて、異なる機能セットを備えた新しいトリプル ストアを選択して移動することが非常に簡単になります。データは既に、誰もが理解できる共通の形式になっており、アプリケーション ロジックはエンコードされています。クエリは完全に移植可能です。また、ほとんどの場合、Sesame API または Jena API に対して記述しているか、SPARQL プロトコルで作業しているため、config/init のみを変更する必要がある場合があります。これは、初期のプロトタイピング フェーズにおける大きな勝利だと思います。

また、RDF/OWL は特に推論と組み合わされており、新しい SPARQL 1.1 で作成できる複雑な SPARQL クエリの種類は、複雑な分析アプリケーションの構築に非常に適していると思います。また、RDF トリプル ストアはスケーリングしないというほとんどの人の印象は、もはや正しくないと思います。この時点で、ほとんどのトリプル ストアは数十億のトリプルに簡単に拡張でき、非常に競争力のあるスループット数も備えています。

したがって、あなたがしていることに基づいて、semweb の方が適していると思います。数年前、単純な Pylons ベースの webapp が前面にあるバックエンドに RDF と RDFS を使用して同様のプロジェクトを行い、その結果に非常に満足していました。

于 2012-06-27T18:40:22.680 に答える