1

オントロジーとかなり大きなデータをロードするために、GraphDB の loadrdf ツールを使用しています。pool.buffer.size=800000 と jvm -Xmx を 24g に設定しました。パラレルモードとシリアルモードの両方を試しました。レポの合計ステートメントが約 10k を超えると、どちらも遅くなります。最終的には、1 秒あたり 1 または 2 ステートメントまで遅くなります。これが loadrdf の通常の動作なのか、それともパフォーマンスを最適化する方法があるのか​​ 誰かが知っていますか?

編集tuple-index-memory を増やしました。私のレポttl構成の一部を参照してください:

owlim:entity-index-size "45333" ; 
owlim:cache-memory "24g" ; 
owlim:tuple-index-memory "20g" ; 
owlim:enable-context-index "false" ; 
owlim:enablePredicateList "false" ; 
owlim:predicate-memory "0" ;  
owlim:fts-memory "0" ; 
owlim:ftsIndexPolicy "never" ; 
owlim:ftsLiteralsOnly "true" ; 
owlim:in-memory-literal-properties "false" ; 
owlim:transaction-mode "safe" ; 
owlim:transaction-isolation "true" ; 
owlim:disable-sameAs "true";

しかし、どういうわけか、プロセスはまだ遅くなります。「世界平均速度: 1,402 st/s」で始まります。しかし、「リポジトリ内のステートメント: 61,831」の後、「グローバル平均レート: 20 st/s」まで減速します。私は自分のjvmを与えます: -Xms24g -Xmx36g

4

2 に答える 2

0

リポジトリ構成ttlを見てきました。次のパラメータがあります: entity-index-size=45333この値を増やす必要があります。たとえば、1 億 (entity-index-size=100000000) に設定します。GraphDB 7 のそのパラメーターのデフォルト値は 10M ですが、明示的に設定したため、オーバーライドされます。

そのパラメーターの詳細については、こちらをご覧ください

于 2016-08-30T08:57:29.967 に答える