オープンソースのXMLデータベース(TPOX、Timber、DBXML)をたくさん見つけましたが、それらはXPathとXQueryで動作しているので、「XMLドキュメントのキーワード検索」を目的として開発されたシステムが必要です。
2 に答える
XMLデータベースの多くは、その中のXMLドキュメントにキーワードインデックスを提供します。XPath式だけに限定されません。データベース内のすべてのドキュメントに対してキーワード検索を実行できます。
多くの場合、XQueryでキーワードクエリを表現する(そしてクエリの結果を処理する)ことができます。例については、exist-dbを参照してください:http://exist.sourceforge.net/kwic.html
特定の要素に限定されたキーワードのサポートがあります。または、ドキュメント全体でキーワードを実行することもできます。すべてのオプションについては、XQueryフルテキスト仕様を参照してください:http ://www.w3.org/TR/xpath-full-text-10/
BaseXは、全文(つまり、キーワード検索)仕様をサポートするもう1つのオープンソースXMLデータベースです:http://www.inf.uni-konstanz.de/dbis/basex/
データベースなしでオープンソースの全文検索が必要な場合は、古いXQengine(http://xqengine.sourceforge.net/ )を確認するか、他の誰かが言ったように、Luceneを使用して、ドキュメント内のすべてのテキストにインデックスを付けます。そのように。
「キーワード検索」とは何かわかりませんが、lucene / solrなどの検索エンジンを設定して、データにインデックスを付けて検索することができます。