いくつかの RDF ダンプを Virtuoso オープン ソース エディション (6.x) にインポートしています。同じデータの異なるシリアル化をインポートする間にパフォーマンスの違いがあるかどうか疑問に思っていました (NT/N3/XML が利用可能です)。
私がそうしている間に、単一のディスクでストライピングを使用したときにインポートのパフォーマンスの違いを見た人はいますか?
特に Virtuoso に関する質問は、公開の OpenLink ディスカッション フォーラム、Virtuoso ユーザー メーリング リスト、または機密のサポート ケースを通じて行うのが一般的です。
とはいえ、インポートのパフォーマンスには多少の違いがあり、負荷のサイズが大きくなるにつれて、その違いはより明確になります。
RDF/XML はほとんどの場合、比較的低速です。これは、トリプルをグラフ ストアに書き込む前に、XML ツリー全体を解析する必要があるためです。
NT は、N3 で処理しなければならないシンタックス シュガーの多くを除外しているため、おそらくNT が最も高速にロードされます。ただし、N3 ファイルは通常、同じデータ セットの NT よりも小さく (場合によっては大幅に) 小さくなり、場合によってはこれが重要な考慮事項になる可能性があります...
結論 -- この質問はニュアンスに満ちており、普遍的に正しい答えはありません。
ここでの各投稿では、1 つの質問のみを取り上げる必要がありますが、1 つのデバイス (HDD であれ SSD であれ) では通常、ストライピングはあまりメリットをもたらしません。この機能は、ストレージを複数のデバイスに分割する場合、それぞれが独自のコントローラーにある場合などに、パフォーマンス上のメリットを最大限に発揮します。