3
- Using openrdf-sesame-latest
- Using in-memory repository in Sesame Standalone Server
- Using REST api interface (SPARQL queries) to Sesame Standalone server
- Have few hundred thousands triples for now
- have 16GB of memory on Sesame Server
- Moderate writes and reads

ここで専門家からの意見/ヘルプを探しています

これを POC として開始し、その上にアプリケーションを構築しました。4Stores と Mulgara、Alleograph (無料) のオプションを検討しています。

  • 経験が少ないので、Sesame Server から離れなければならないのはいつになるのだろうかと考えていました。
  • スケール、セキュリティ、書き込み/読み取りパフォーマンスなどでしょうか?
  • たとえば、トリプルが 100,000 個しかない場合、他のストアに移動する必要はありますか? また、その理由は?
  • 本番ユースケースにも使用するつもりです。

絶対に必要でない限り、移行に時間を費やすことを避けようとしているだけです。別の言い方をすれば、「openrdf-sesame-latest Standalone サーバーとインメモリ リポジトリ (16GB) を本番環境で使用できますか? そうでない場合は、なぜですか?

4

1 に答える 1

9

ゴマの開発者の一人である私は明らかに偏見がありますが、なぜあなたができなかったのかわかりません。

ゴマは多くの実稼働環境でうまく使用されています。メモリストアは使用可能なRAMの量に応じて拡張されます。個人的には、数百万を超えるトリプルでテストしたことはありませんが、ヒープスペースが不足しない限り、パフォーマンスを大幅に低下させることなく追加を継続できると思います。 。小さな100,000トリプルについておっしゃっていますが、Sesameは桁違いに大きなデータセットに簡単に対応できます。

Sesameの利点は、実際には単一のトリプルストアではなく、複数のストレージバックエンドをサポートするフレームワークとAPIであるということです。たとえば、1億5000万トリプルまでの場合、Sesameネイティブストアは優れたソリューションです(永続性が向上し、メモリフットプリントが少なくなります。これは、データ量がメモリに収まる場合でも、これを使用する理由となる可能性があります)。

それを超える必要がある場合は、OWLIMやBigDataなどのサードパーティのトリプルストアを含むSesame APIをサポートする他のオプションがいくつかあります。したがって、より大きなトリプルストアが必要な場合でも、コードレベル-別のストアに接続するだけです。

于 2012-07-09T23:59:54.233 に答える