0

履歴書を含む巨大な XML ファイルがあります。このファイルは 2 つの形式、つまり - すべての履歴書を含む単一のマスター ファイルです。

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
  ......
  ......
</Resumes>

およびex-の複数のファイル

ファイル1-

<Resumes>
  <Resume>
    <Name>ABC</Name>
    ......
    ......
  </Resume>
</Resumes>

ファイル-2

<Resumes>
  <Resume>
    <Name>PQR</Name>
    ......
    ......
  </Resume>
</Resumes>

等々。

baseXXML を格納するために XML DBまたはeXistXML DBを使用したいと考えています。将来、履歴書 (XML) 形式をさらに追加したい場合 、どちらが良いでしょうか?

4

1 に答える 1

2

eXist-db については、同様の質問に対するWolfgang Meier による exist-open の投稿から引用させてください。

理論的な制限はないと思いますが、実用的な考慮事項がいくつかあることは確かです。非常に大きなドキュメントを格納すると、多数の小さなドキュメントを格納するよりもデータベースがブロックされる可能性があります。単一のトランザクション (およびトランザクション ログ用の十分なディスク領域) が必要です。

いくつかの自動パフォーマンス テストに使用する dblp 文献目録は、600 MB を超える単一のドキュメントとして提供されます。これは、キャッシュ サイズとメモリ設定をわずかに増やすと、うまくロードされます。他のユーザーがはるかに大きなドキュメント (数ギガバイト) を処理しなければならないことは承知していますが、選択肢がある場合は、データをより小さなチャンクに分割することを強くお勧めします。

確かに、Wolfgang がこの記事を書いた 2009 年 11 月以降、eXist-db はさらに効率的かつ堅牢になりましたが、彼のアドバイスは今でも当てはまると思います。最後に 2 つの注意事項:

  1. eXist の最新バージョン ( 1.4.2または2.0 Tech Previewなど) を使用していることを確認してください。これらは、私が話した進歩の恩恵を受けています。

  2. eXist-db のパフォーマンスを最大限に引き出すには、eXist-db のドキュメント記事「パフォーマンス チューニング」を参照してください。

于 2012-04-29T00:03:56.377 に答える