5

最新のメモリ効率の高い高性能のJavaXML解析APIを探しています。3MBから5MBのXMLファイルを解析する必要があります。

私はこれについてグーグルで検索し、Sun Java Streaming XMLパーサー(SJSXP)について知りました。また、WoodstoxはDOMやSAXよりもはるかに高速です。どちらもStAXAPIを使用しています。*スキーマ検証はこれらのテクノロジーではサポートされていません。

AaltoXMLプロセッサもStAXAPIを実装しています。

これらのテクノロジーのパフォーマンスに関する具体的な調査結果は見つかりませんでした。

メモリ効率、高性能、使いやすさの観点から、どれが最適ですか?

4

2 に答える 2

3

関連する可能性のあるその他のリンクを次に示します。

パフォーマンスに関して: SJSXP が最も遅いです。これは、Stax API にラップされた、Xerces の内部を再パッケージ化したものです。これは、パフォーマンスに悪影響を及ぼします (実際にはプル解析用に設計されていないため)。Woodstox は少し高速です。小さなドキュメントや書き込みでははるかに高速ですが、長いドキュメントを解析するときの違いは少なくなります。

そして、Aalto は、特に解析において、3 つの中で群を抜いて高速です。通常、Woodstox または SJSXP よりも 50% ~ 100% 高速です。欠点の 1 つは、DTD を処理しないことです (したがって、外部エンティティは処理されません。定義済みエンティティと文字エンティティを処理します)。

免責事項: 私は Woodstox と Aalto の著者です。SJSXP への貢献 (バグ修正)

于 2012-08-02T17:32:32.107 に答える
0

上記のクエリに役立つリンク:

http://www.developerfusion.com/article/84523/stax-the-odds-with-woodstox/ (2010 年 6 月)

http://www.ibm.com/developerworks/opensource/library/os-ag-renegade15/ (2007 年 7 月)

パフォーマンス ベンチマークの詳細:

http://www.xml.com/pub/a/2007/05/09/xml-parser-benchmarks-part-1.html (2007 年 5 月)

于 2012-08-02T10:11:31.620 に答える