大規模なデータセットに使用するのに適したトリプルストアについてお聞きしたいのですが、次のようにする必要があります。
- 十分にスケーリング (数百万のトリプル)
- Java インターフェースを持っている
大規模なデータセットに使用するのに適したトリプルストアについてお聞きしたいのですが、次のようにする必要があります。
OpenLinkVirtuosoストアの使用を検討する必要があります。オープンソースライセンスを介して利用可能であり、数十億のトリプルに拡張できます。SesameおよびJenaAPIを介して使用できます。
大規模なトリプルストアの概要については、こちらをご覧ください。Virtuosoは、BigDataよりもセットアップが間違いなく簡単です。それに加えて、私はSesame NativeStoreを使用しましたが、これはあまり拡張性がありません。
私は使ったことがありませんが、 4Storeも良い選択です。4Storeに対するVirtuosoの利点の1つは、Virtuosoがリレーショナルデータベースの内部にあるため、標準のリレーショナルモデルをRDFと簡単に組み合わせることができることです。
4store Web 引用...
4store の主な強みは、そのパフォーマンス、スケーラビリティ、および安定性です。RDF ストレージと SPARQL クエリ以上の多くの機能を提供するわけではありませんが、スケーラブルで安全、高速かつ効率的な RDF ストアを探している場合は、4store を候補リストに含める必要があります。
個人的には、非常に大きなデータベース (最大 20 億のトリプル) で 4store をテストしましたが、非常に良い結果が得られました。4store は C で記述され、Linux/Unix 64 ビット プラットフォームで実行され、現在のバージョン 1.1.1 はSPARQL 1.1を部分的に実装しています。
4store は、クエリのパフォーマンスを向上させるコモディティ サーバーのクラスターに展開でき、アサーション スループットは最大 100 KTriples/秒に達する可能性があります。ただし、単一のサーバーで使用しても、かなりのパフォーマンスが得られます.
ここサウサンプトン大学では、研究プロジェクトの非常に大きなデータセットやウェブマスター チームに最適です。サウサンプトンおよび ECS オープン データのデータ ストアを参照してください。
ここには、4storeクライアント ライブラリのクエリと管理に使用できるすべてのライブラリのリストもあります。また、4store の IRC チャネルには、問題が発生した場合に役立つアクティブなユーザー コミュニティがあります。
あなたが Linux/Unix ユーザーなら、4store は間違いなく良い選択です。
4store もお勧めしますが、完全開示の精神で、私はリード アーキテクトでした :)
RDF ストアの標準化を利用したい場合は、Java API をネイティブに公開するライブラリを使用するのではなく、SPARQL を実装する Java ライブラリの使用を検討する必要があります。
そうしないと、最初に選択したストアに行き詰まる可能性があります。これは、典型的な SQL 移行地獄です。
私は個人的にGraphDBに非常に満足しています。これは、150億トリプルのミディアムハードウェア(256GB RAMサーバー)で非常にうまく動作します。これは、ゴマとイエナの両方のインターフェースを介してアクセスできます。(イエナはベータ版ですが)。
余裕があれば、Oracle12cインスタンスは悪くありません。また、既存のOracleインフラストラクチャ(バックアップなど)に適合する場合があります。
Virtuoso 7.1は非常に優れた拡張性を備えており、膨大なデータ量を妥当なコストで処理できます。残念ながら、そのSPARQL標準への準拠は不十分です
@Steve - コメントの仕方がわからないので、一度に 2 つの質問に答えるつもりです。
以下の SPARQL 用の JDBC ドライバー:
http://code.google.com/p/jdbc4sparql/
SPARQL プロトコルと SPARUL をサポートします (更新として SPARQL プロトコル経由であり、SPARUL プロトコル経由ではありません)。
@ミヤヤ
4Storeは非常におすすめなので、候補として評価する価値があります。
Virtuoso にはネイティブ JDBC ドライバーもあり、大規模なデータセット (最大 120 億のトリプル) をサポートします。
www.openlinksw.com/wiki/main/Main/
また、オラクルには何かがありますが、大金を支払う準備をしてください。
http://www.oracle.com/technetwork/database/options/semantic-tech/index.html
4Store、Virtuoso、Owlim に加えて、Bigdataも注目に値します。