rdf - トライノード構造のようにトリプルを表現しない Web セマンティックフレームワークはありますか?

Question

私の仕事では、数十億のトリプルを使用する巨大なアプリケーションを構築しています。これらのトリプルを格納するために必要なスペースを最適化するために、私はトリプルを表現する別の方法を探していました。より経済的な方法であれば何でも歓迎します。ありがとう

score 3 · Accepted Answer

数十億のトリプルを格納するために必要なスペースが、SQL データベースに数十億の行を格納するために必要なスペースよりも現実的に悪いとは思いません。

ほとんどのシステムがネイティブストア/SQL ベースのどちらであるかにかかわらず、一般的なアプローチは、ノードに ID を割り当て、各トリプルを 3 つのノード ID として保存することです。ノード ID 生成の適切な選択と、ノード ID とノード値の間の効率的なインデックスがあれば、大規模にスケールアウトするストアを簡単に構築できます。

さらなる最適化として、一部のストアでは、単純な値の型 (整数、ブール値、日時など) の値が直接ノード ID にエンコードされるようにノード ID を生成するため、ID から値へのルックアップを行う必要はありません。 (またはそのようなデータを挿入する場合はその逆)

score 3 · Accepted Answer

また、neo4j のように、物事をトリプルとして保存しないクラス全体のグラフストレージシステムもあります。しかし、物事をトリプルとして保存するという理由だけで、トリプルストアを除外するつもりはありません ;-) 今日の現在のソリューションの多くは、すでに数十億のトリプルを保存しているため、元に戻すことはできません (ただし、それよりも 1 つまたは 2 つのオーダーが高くなると、物事は取得されます)。タフ）。私は個人的にアレグログラフの店を10億以上で埋め尽くしました.

このスレッドを参照してください: http://www.semanticoverflow.com/questions/3332/scalable-owl-rdf-database

score 2 · Accepted Answer

RobV が言うように、ほとんどすべてのストアが内部値/ノード ID をトリプルの要素に付加します。そうは言っても、トリプルストアの多くのスペースは、ルックアップに必要なさまざまなインデックスによって占有されます。リレーショナルデータベースでは、使用しているデータモデルに基づいてインデックスの数を簡単に減らすことができます。トリプルストアでは、これは非常に難しく、ストアは基本的に、トリプルの要素を順序付けできるさまざまな方法で多数 (6 つ以上) のインデックスを作成します。

score 0 · Accepted Answer

いわゆるトリプルストアがたくさんあります。ウィキペディアまたはW3Cを参照して、いずれかを選択してください。

rdf - トライノード構造のようにトリプルを表現しない Web セマンティック フレームワークはありますか?

4 に答える 4

Related

Reference

rdf - トライノード構造のようにトリプルを表現しない Web セマンティックフレームワークはありますか?