0

約 50,000 (またはそれ以上) のドキュメントについて説明したいと思います。Jena を使用してデフォルト モデルを作成し、リソースと対応するプロパティの追加を開始しました。トリプル ストアを行ったり、Jena の TDB データセットを使用したりしたことはありません。将来のクエリと最も重要な UPDATES がはるかに効率的/高速であることを確認するためのベスト プラクティスは何ですか。誰かが、各グラフに名前を付けたり、別のファイルに分けたりすることを提案しました。

4

1 に答える 1

1

メモリに保存しきれないほど多くのデータがある場合は、RDF データベースを使用してください。ディスク上の多くのファイルは、それほど効率的ではありません。

Apache Jena TDB などのインプロセス データベースを使用するか、RDF データベース サーバー (Jena Fuseki) を共有します。

別のサーバーとは、そのために必要な SPARQL 準拠のシステムを使用できることを意味します。

于 2013-08-22T17:30:41.080 に答える