2

Drupal /SearchAPIモジュール/Solr/ Tikaを使用して、多数のファイルのインデックスを作成しようとしています。

インデックスを設定しましたが、SearchAPI添付ファイルモジュールを含めるまではすべて正常に機能します。

cronを実行すると、tikaは呼び出されません。これは、tikaモジュールの最後にシステムログに書き込むPHPコードのスニペットを挿入し、そのメッセージが表示されないためです。インデックスを手動で実行すると表示されます。

さらに、cronの実行後、アイテム数のインデックスは増加しません。

また、コマンドラインからtikaを実行すると、出力の上部に次のエラーが表示されることにも気づきました。INFO-サポートされていない/無効な操作:EI

cronで添付ファイルにインデックスを付けるチェックボックスをオンにしなくても、手動でインデックスを作成しても、インデックスは期待どおりに機能します。

問題が何であるかについて何か考えはありますか?

ありがとう!

構築されたサイト:

  • Drupal 7

問題のモジュール:

  • 検索API
  • API添付ファイルを検索

インデックス作成:

  • Apache Solr

以下を使用して添付ファイルにインデックスを付ける:

  • ティカ図書館
4

1 に答える 1

0

私も同じ問題を抱えてる。しかし、文書はいずれにせよ索引付けされているように見えるので、まったく問題にはならないようです。

一部のドキュメント (pdf) がうまく機能し、他のドキュメントが機能しないため、これは Tika の問題だと思います。pdfのバージョンにもよるかもしれません。もっと簡単なことを試してみてください。IE サンプル テキストを作成し、Mac で print to pdf 機能を使用して単純な pdf ドキュメントを取得しました。または、Word 文書を使用します。また、Tika がファイルを操作できるように実パス パッチを適用する必要がありました...そして文字変換モジュールがクリーンなファイル名を持つようにする必要がありました。search_api のデバッグには、devel の dd() 関数を使用します。search_api_solr/includes/solr_httptransport.inc performHttpRequest() で 、 (行:92)dd($url); dd($options);の直前に呼び出します...これが役立つことを願っています。$response = drupal_http_request($url, $options);

于 2012-09-27T15:50:54.903 に答える