1

抽出ハンドラーを使用して、複数のファイル(2つのPDFと1つのドキュメントなど)を1つのsolr-index-docに追加する方法またはベストプラクティスはありますか?クエリを実行したときの結果は、次のようになります。

<result name="response">
 <str name="id">123</str>

  <doc>
   <arr name="attr_content">
    content of pdf-1
   </arr>
  </doc>

  <doc>
   <arr name="attr_content">
    content of pdf-2
   </arr>
  </doc>

  <doc>
   <arr name="attr_content">
    content of doc-1
   </arr>
  </doc>

</result>

私のJavaアプリケーションでは、1つのファイルのみを追加するようなファイルをSolr-Indexに追加しています。

ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
up.addFile(new File("c:\\document1.pdf"));
up.setParam("literal.id", solrId);
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
solr.request(up);
4

1 に答える 1

0

1つのファイルを添付ファイルとして添付することができます。
Solrでは、zipファイルにインデックスを付けることができます(パッチ)。これにより、ファイルのコンテンツにインデックスが付けられます。
したがって、ファイルをzipにパッケージ化して、単一のドキュメントとして索引付けされるSolrにフィードすることができます。

于 2011-10-25T16:59:03.153 に答える