1

PDFをSolrに保存できるように(ローカル環境で)設定しようとしていますが、機能させることができません。現在、Solr が提供するサンプル フォルダー内のファイルを操作しています。

solr-3.6.0/example/conf の solrconfig.xml は変更しませんでした。リクエスト ハンドラの抽出で説明されているように、既に構成されているようです。つまり、すでにこれが含まれています:

<lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar" />
<lib dir="../../contrib/extraction/lib" regex=".*\.jar" />

この:

<requestHandler name="/update/extract" 
              startup="lazy"
              class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
  <str name="fmap.content">text</str>
  <str name="lowernames">true</str>
  <str name="uprefix">ignored_</str>
  <str name="captureAttr">true</str>
  <str name="fmap.a">links</str>
  <str name="fmap.div">ignored_</str>
</lst>

次のコマンドを使用して、example ディレクトリから Solr を実行しています。

java -jar start.jar 

そして、次のコマンドでPDFをSolrに送信しようとしています:

java -Durl=http://localhost:8983/solr/update/extract -Dauto -jar /Applications/Solr-3.6.0/example/exampledocs/post.jar /path/to/pdf/mypdf.pdf

/Solr-3.6.0/example/solr/conf/schema.xml に変更を加えないと、次のメッセージが表示されます。

FATAL: Solr returned an error #400 [doc=null] missing required field: id

schema.xml の id 要素の "required" プロパティの値を false に変更すると、次のようになります。

FATAL: Solr returned an error #400 Document is missing mandatory uniqueKey field: id

要素の必須プロパティがスキーマで false の場合、そのフィールドを含まないファイルを送信するだけでよいと思いますが、明らかにそうではありません。

また、そのpdfを送信するコマンドにパラメーター-Dparams=literal.id=mypdf1を追加しようとしましたが、それも役に立ちません。何かご意見は?

4

1 に答える 1

1

私の混乱は、Solrに送信するドキュメントのIDが必要であると同時に、Solr-3.6.0 / example / solr /conf/スキーマにid要素があるためだと思います。 xml

私が得た最初のエラーは、スキーマのid要素を参照していたと思います。2番目のエラーは、ドキュメントIDを参照していました。

ZeroPageの助けを借りて、ドキュメントIDを個別のパラメーターとして渡す代わりに、URLに追加することで、2番目のエラーも克服することができました。このクエリは私のために働くようになりました:

java -Durl=http://localhost:8983/solr/update/extract?literal.id=form1 -jar /Applications/Solr-3.6.0/example/exampledocs/post.jar /path/to/pdf/form1.pdf 

SolrにPDFの全コンテンツのインデックスを作成させたい場合は、uprefixfmap.content属性を追加する必要があります。

java -Durl="http://localhost:8983/solr/update/extract?literal.id=form1&uprefix=attr_&fmap.content=attr_content&commit=true" -jar /Applications/Solr-3.6.0/example/exampledocs/post.jar /path/to/pdf/form1.pdf
于 2012-08-30T15:28:10.163 に答える