複数の個別のカスタム XML ドキュメントを Java で解析する最良の方法は何ですか?
6 に答える
基本的に、Java には 2 つの主要な XML 解析メソッドがあります。
もう 1 つの非常に便利な XML 解析メソッドは、これらのメソッドよりも少し新しいものであり、Java6 以降でのみ JRE に含まれていますが、StAXです。StAX は、DOM のツリー ベースと SAX のイベント ベースのアプローチの間の中間的な方法として考えられました。非常に大きなドキュメントの解析が簡単であるという点で SAX と非常によく似ていますが、この場合、アプリケーションはイベントを解析してアプリケーションに「プッシュ」するのではなく、パーサーから情報を「プル」します。この件に関する詳細な説明は、こちらでご覧いただけます。
したがって、達成したいことに応じて、これらのアプローチのいずれかを使用できます。
使用することをお勧めしますorg.xml.sax.XMLReader
(http://docs.oracle.com/javase/7/docs/api/org/xml/sax/XMLReader.html)。
dom4jライブラリを使用する
まずドキュメントを読む
import java.net.URL;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.io.SAXReader;
public class Foo {
public Document parse(URL url) throws DocumentException {
SAXReader reader = new SAXReader();
Document document = reader.read(url);
return document;
}
}
次に、XPATH を使用して必要な値を取得します。
public void get_author(Document document) {
Node node = document.selectSingleNode( "//AppealRequestProcessRequest/author" );
String author = node.getText();
return author;
}
解析のみが必要な場合は、XPath ライブラリの使用をお勧めします。ここに参考文献があります: http://www.ibm.com/developerworks/library/x-javaxpathapi.html
しかし、XML をオブジェクトに変換することを検討したいと思うかもしれません。そのためにXStreamを使用できます。これは私がよく使用する優れたライブラリです
以下は、 vtd-xmlを使用して値値を抽出するコードです。
import com.ximpleware.*;
public class extractValue{
public static void main(String s[]) throws VTDException, IOException{
VTDGen vg = new VTDGen();
if (!vg.parseFile("input.xml", false));
VTDNav vn = vg.getNav();
AutoPilot ap = new AutoPilot(vn);
ap.selectXPath("/aa/bb[name='k1']/value");
int i=0;
while ((i=ap.evalXPath())!=-1){
System.out.println(" value ===>"+vn.toString(i));
}
}
}