5

多数の PDF ドキュメントにインデックスを付けたいと考えています。

Apache Tika を使用して実行できることを示すリファレンスを見つけましたが、残念ながら、Solr 1.4.1 で Apache Tika を構成できることを説明するリファレンスを見つけることができません。

構成したら、構成済みですが、curl を使用せずにドキュメントを Solr に直接送信するにはどうすればよいですか?

インデックス作成にsolrnetを使用しています。

4

2 に答える 2

5

ExtractingRequestHandlerを参照してください

于 2010-10-05T13:12:54.510 に答える
3

SolrNetでのExtractingRequestHandlerのサポートはまだ完了していません。実装を完了するか、回避して独自のHttpWebRequestsを作成することができます。

于 2010-10-05T14:08:14.200 に答える