私はMarklogicの世界に不慣れです。私のプログラムは、カスタム Java アプリを使用して、30 秒ごとに Then.com fetch XML データ フィードをクエリします。結果は XML 形式で返されます。Java アプリは、XCC API (Marklogic API) を使用して、取得したデータを単一の XML ファイルで ML に挿入します。データのサイズは毎分 6 MB です。アプリケーションを 1 日程度実行すると、データ量は GB 単位で増加します。この量の膨大なデータを MarkLogic の単一の XML ファイルに入れるために必要な管理者構成については知りません。誰かが私のアプローチを検証したり、管理者レベルで構成を変更する必要があるかどうかを提案したりできますか? XMLの構造は次のとおりです...
<?xml version="1.0" encoding="UTF-8"?>
<moreovercontentdump>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
</moreovercontentdump>