オントロジーとかなり大きなデータをロードするために、GraphDB の loadrdf ツールを使用しています。pool.buffer.size=800000 と jvm -Xmx を 24g に設定しました。パラレルモードとシリアルモードの両方を試しました。レポの合計ステートメントが約 10k を超えると、どちらも遅くなります。最終的には、1 秒あたり 1 または 2 ステートメントまで遅くなります。これが loadrdf の通常の動作なのか、それともパフォーマンスを最適化する方法があるのか 誰かが知っていますか?
編集tuple-index-memory を増やしました。私のレポttl構成の一部を参照してください:
owlim:entity-index-size "45333" ;
owlim:cache-memory "24g" ;
owlim:tuple-index-memory "20g" ;
owlim:enable-context-index "false" ;
owlim:enablePredicateList "false" ;
owlim:predicate-memory "0" ;
owlim:fts-memory "0" ;
owlim:ftsIndexPolicy "never" ;
owlim:ftsLiteralsOnly "true" ;
owlim:in-memory-literal-properties "false" ;
owlim:transaction-mode "safe" ;
owlim:transaction-isolation "true" ;
owlim:disable-sameAs "true";
しかし、どういうわけか、プロセスはまだ遅くなります。「世界平均速度: 1,402 st/s」で始まります。しかし、「リポジトリ内のステートメント: 61,831」の後、「グローバル平均レート: 20 st/s」まで減速します。私は自分のjvmを与えます: -Xms24g -Xmx36g