2

XMLを使用してタグ付けされた情報のデータベースがあります。XMLは、検索とクエリで説明したい階層を表しています。たとえば、データが本のメタデータである場合:

<book>
    <author id="jd112">John Doe</author>
    <title>John's First Publication</title>
    <summary>This is a mundane memoir of John's life that no one else would care to read </summary>
</book>

そのようなXMLドキュメントがたくさんあります。検索者にクエリを特定のフィールドに制限してもらいたい。また、検索者がそれらを論理的に組み合わせられるようにしたいと思います。

Lucene / Solrはそのような機能を提供しますか、それとも他のテクノロジーを検討する必要がありますか?Luceneの場合は、これについてどのように取り組むかについてのポインタが役立ちます。

あなたの洞察に感謝します。

-ラジ

4

3 に答える 3

2

はい、それを使用するのが最善の方法ですが、ドキュメントはおそらく再フォーマットする必要があります

http://www.xml.com/pub/a/2006/08/09/solr-indexing-xml-with-lucene-andrest.html

およびschema.xmlの構成についてのグーグル

于 2012-07-19T16:50:33.187 に答える
1

自分でSorlxml形式に変換せずにxmlファイルをインポートできます。DataImportHandlerを使用てxsl変換を適用するだけです。

于 2012-07-19T19:04:03.803 に答える
0

XMLドキュメントのインデックスを作成する方法はいくつかあります。

  1. たとえば、Apache SorやElasticSearchなどの検索エンジンテクノロジーを使用できます。どちらも、インデックス作成にLuceneをベースにしています。
  2. Luceneに基づくLuXforXMLなどのNoSQLデータベーステクノロジーを使用する

お役に立てれば

于 2018-12-03T10:29:46.133 に答える