java - Java でさまざまなカスタム XML ドキュメントを解析するための最良の方法

Question

複数の個別のカスタム XML ドキュメントを Java で解析する最良の方法は何ですか?

score 6 · Accepted Answer

私はStaxを使用してXMLを解析します。これは、高速で使いやすいです。私は前回のプロジェクトでこれを使用して、最大24MBのXMLファイルを解析しました。java.netには、始めるために知っておく必要のあるすべてのことを説明するすばらしい紹介があります。

score 4 · Accepted Answer

基本的に、Java には 2 つの主要な XML 解析メソッドがあります。

SAX、ハンドラーを使用して XML で必要なものだけを取得し、残りを捨てる
DOMは、ファイルを最初から最後まで解析し、よりツリーのような方法ですべての要素を取得できるようにします。

もう 1 つの非常に便利な XML 解析メソッドは、これらのメソッドよりも少し新しいものであり、Java6 以降でのみ JRE に含まれていますが、StAXです。StAX は、DOM のツリーベースと SAX のイベントベースのアプローチの間の中間的な方法として考えられました。非常に大きなドキュメントの解析が簡単であるという点で SAX と非常によく似ていますが、この場合、アプリケーションはイベントを解析してアプリケーションに「プッシュ」するのではなく、パーサーから情報を「プル」します。この件に関する詳細な説明は、こちらでご覧いただけます。

したがって、達成したいことに応じて、これらのアプローチのいずれかを使用できます。

score 3 · Accepted Answer

使用することをお勧めしますorg.xml.sax.XMLReader（http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html）。

score 3 · Accepted Answer

dom4jライブラリを使用する

まずドキュメントを読む

import java.net.URL;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;

public class Foo {

    public Document parse(URL url) throws DocumentException {
        SAXReader reader = new SAXReader();
        Document document = reader.read(url);
        return document;
    }
}

次に、XPATH を使用して必要な値を取得します。

public void get_author(Document document) {
    Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
    String author = node.getText();
    return author;
}

score 2 · Accepted Answer

解析のみが必要な場合は、XPath ライブラリの使用をお勧めします。ここに参考文献があります: http://www.ibm.com/developerworks/library/x-javaxpathapi.html

しかし、XML をオブジェクトに変換することを検討したいと思うかもしれません。そのためにXStreamを使用できます。これは私がよく使用する優れたライブラリです

score 0 · Accepted Answer

以下は、 vtd-xmlを使用して値値を抽出するコードです。

import com.ximpleware.*;

public class extractValue{
    public static void  main(String s[]) throws VTDException, IOException{
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("input.xml", false));
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/aa/bb[name='k1']/value");
        int i=0;
        while ((i=ap.evalXPath())!=-1){
            System.out.println(" value ===>"+vn.toString(i));
        }   
    }
}

java - Java でさまざまなカスタム XML ドキュメントを解析するための最良の方法

6 に答える 6

Related

Reference