3

最近、XMLドキュメントでデータマイニングを行う必要があります。そのほとんどはアドホックです。つまり、事前にドキュメントのスキーマがなく、クエリを数回実行するだけです。クエリの例としては、「このサブ要素の値が0より大きい要素の数」、または「ある種の要素ごとに、それらのサブ要素のいくつかの値の合計はいくつですか」などがあります。

このようなクエリをJavaで実行するのは、(a)Java DOM処理が非常に面倒であり、(b)アプリケーションの一部としてではなく、これらのクエリを数回実行するだけでよいため、厄介です。

このシナリオで推奨され、現在サポートされているクエリ言語とツールは何ですか?インタラクティブで、無料/オープンソースであることが望ましく、事前にデータベースにドキュメントを保存する必要はありません(オプションですが)。

4

2 に答える 2

2

XQueryが必要です。XQueryホームページの引用から読むことができるように、XMLを簡単にクエリすることを目的としています。

XQueryは、複雑なJavaまたはC++[XML処理]プログラムを数行のコードに置き換えています。

私はオープンソースプログラムBaseXを使用して、 XMLファイル(の大規模なコレクション)を簡単に照会します。また、XML構造の優れたインタラクティブな視覚化も備えています。

于 2012-06-11T13:41:53.377 に答える
1

XQueryの説明のように聞こえます。

クエリの例

count(//element[sub-element gt 0])

//some-element/sum(sub-element)

実際には、どちらもXQuery1.0のサブセットであるXPath2.0ですが、遅かれ早かれXQuery 1.0が必要になる可能性があり、XPath2.0よりも広く実装されているのでそれを選択してください。XMLデータベースの有無にかかわらず、Java環境で動作するXQueryプロセッサはたくさんあります。私自身のSaxon製品はその一例です。

于 2012-06-11T10:41:58.933 に答える