2

ファイル、Webサーバー、その他のサーバーなど、任意のxmlソースから要素名の値(時系列データ)のペアをフェッチするアプリケーションを作成する必要があります。アプリケーションはXMLを消費し、対象の値を取得します。非常に高速である必要があり(たとえば、50000イベント/秒以上)、XMLドキュメントのサイズも大きくなり、これらのドキュメントの頻度も高くなる可能性があります(例:2500ファイル/分-500MBを超えるXMLデータ/ファイル)。

私はあなたが経験した人々が私がこれに取り組むべきだとどのように考えているかを見たいだけです。私は始めたばかりの初心者ですが、どんなにタフで簡単でも、あなたが提案してくれた解決策は何でもできます。

どうもありがとうございます。

4

3 に答える 3

4

SAX解析を使用する場合、ボトルネックは、XML文字列処理ではなく、関連するI/Oです。また、500 MBの数値を考えると、DOM解析の代わりにSAX解析を実行する必要があると思います。したがって、SAXタイプのインターフェースを備えたものなら何でも問題ありません。

于 2009-09-10T01:31:14.287 に答える
2

私はXercesのファンです。アプリケーションに最適なパフォーマンスを確認するには、Xercesを試してみる必要があると思います。ウォーレンが言ったように、SAX処理を使用したいと思うでしょう。現実的には、本当にパフォーマンスが必要な場合は、専用のXMLアプライアンスを使用して処理を行う必要があります。

于 2009-09-10T01:49:54.470 に答える
0

私はプロジェクトでlibxml2を使用しています。SAXとDOMの両方をサポートします。ウォーレン・ヤングが言ったように、あなたはSAXを使うべきです。Expatを試してみることができます。

于 2009-09-10T13:00:56.363 に答える