サイズが約 500 行の XML ファイルに対して、次のソリューションを実行しました。
XSLT変換 を使用して、必要な要素ファイルを含む大きなXMLファイルを小さなXMLに変換- JavaコードでSAXON XMLパーサーを使用するよりも、これらの新しく生成されたファイルの解析を行いました
- JAXB の概念を使用するよりも、XML を Java オブジェクトに、さらに SQL SERVER に非整列化しました。
しかし、今では、15000 行以上の非常に大きく、非常に構造化されていない新しい XML ファイルがあります。したがって、上記のソリューションを使用してデータベースにデータを取得することは非常に非効率的です。これらの大きなファイルを操作するための最善の解決策を見つけようとしています。私はいくつかの調査を行い、構造化されていない XML ファイルの複雑さを軽減することができる "Altova XML スパイ" と呼ばれるこのツールに出会いました。また、これらの大きなファイルを Hadoop クラスターにダンプし、Hive/Pig を使用してデータを取得することも考えました。
だから私の質問は、誰かが新しい解決策や手順を提案できるかということです. 大きな XML ファイルを少し複雑でないファイルにして再生できるツール。
これだけの情報で十分であることを願っています。他に必要なものがあれば教えてください。
前もって感謝します。