問題タブ [manifoldcf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Datafari を使用して画像からメタデータを検索する
あらゆる種類のファイル (テキスト: [pdf、doc...]、画像 [jpg、png、bmp...]、ビデオ [mov、mp4...] のインデックスを作成するオープン ソースのドキュメント管理システムを探しています。 ])そして私はDatafariに出くわしました
Solr検索エンジンとManifoldCFを使用してコンテンツ リポジトリ接続を管理し、メタデータの検索に役立つTika コネクタを備えています。
私はそれをインストールし、メタデータ基準で検索された画像を見つけるために設定をしようとしていますが、今のところ運がありません.
いくつかのメタデータを含むイメージを含むローカル リポジトリを追加しました。
solr schema.xml に、必要なフィールドを追加しました。
その後、サーバーを再起動しました
ジョブ リストの ManifoldCF 管理で、ジョブに Tika extractor 変換を追加しました: パイプラインは: my repository -> Tika Extractor -> DatafariSolr です。
Solrインターフェースで検索を試みました:qの場合、試してみたところ"subject:legs"
、Solrインターフェースでデータを取得しました
しかし、Datafari 検索エンジンでは、結果がありません
Datafari のヘルプはあまり役に立たず、Manifoldcf のドキュメントを調べましたが、うまくいきませんでした。メタデータを介したこの種の検索の実際の例が欲しいです。結果に画像が表示されるようにするには、何を変更および/またはテストする必要がありますか?
Olivier Tavardの回答後の更新:
ご協力ありがとうございました。このツールは非常に有望ですが、まだ設定に問題があります。
datafari/WebContent/js/search.js が見つかりません。もしかして: datafari/tomcat/webapps/Datafari/js/search.js ?
あなたが提案したものを追加しました。
フィールド「説明」と「作成者」も追加しました。
1 - SolR 検索: - q " animal " で検索すると、("animal" ではなく) 自分の画像を取得できます。これは、"description: animal " よりも優れています。- しかし、「脚」を検索しても何も検索されません。<meta> の「件名」が複数あるため、検索の仕方が違うのでしょうか?- 「tarzan」(作成者フィールドから) を検索しても、何も取得されません。
2 - Datafari UI 検索: - 私が行った変更により、検索が「壊れた」ようです: 検索すると、常にホイールが回転しています。コンソールには次のものがあります。
3 - 同じフィールドの他のメタデータを含む別の画像を追加しました。SolR 検索で「jpg」をクエリすると、両方が表示されます (OK) が、json 応答では、余分なフィールドが他のフィールドに表示されません。画像 !
私はとても混乱しています。
Olivier Tavardの回答後に編集
返信が遅れて申し訳ありません。私は何か緊急の ATM に取り組んでおり、希望どおりにテスト/回答できませんでした。
私はあなたの手順に従いました(非常に教訓的です、ありがとう)、クライアント検索で結果を得ることができました:)
しかし :
1- datafari gui でそれを見つけるためにワイルドカードを使用する必要がありました:「a horse in disguise」 => 「horse」ではなく「**horse*」と入力する必要がありました
2 - 複数のフィールドのデータを取得する方法 (例: meta:keyword ...)
3 - 「標準」インストールをしましたが、localhost:8080/Datafari/css/menu.cssに 404 があります。ページを更新するまでサーチホイールが表示されるのはそのためかもしれません。
spring - Spring Data Solr を使用しながら Solr にカスタム パラメーターを追加する
次のリクエストを生成する Spring Data Solr を使用して、Solr クエリに追加のパラメーターを追加することは可能ですか?
Apache Manifoldcf で必要なパラメーター、AuthenticatedUserName とその値を、Spring Data Solr (q、wt) によって自動的に入力される他のパラメーターと一緒に追加したいと考えています。
ありがとう、V.
indexing - マニホールド cf は Google ドライブのインデックス作成に適したオプションですか?
Googleドライブからsolrにドキュメントをインデックス化するために、apache manifestcfオープンソースプロジェクトを使用しています。多くの場合、データのインデックス作成に一貫性がありません。また、solr では、少数のドキュメントでも反映に時間がかかります。それを使用してGoogleドライブをインデックス化するのは良いオプションだと本当に思いますか?
elasticsearch - 索引付け ACL ManifoldCF + ElasticSearch + CMIS
ManifoldCF と CMIS コネクタを使用して、Elastic Search で ACL のインデックスを作成する必要があります。パラメータを使用して CMIS 機関コネクタを追加しました。
しかし、ACL はドキュメントでインデックス化されていません。次のようなものがあります。
お願い助けて。
lastaccesstime - マニホールドcfを使用してlastaccesstimeを維持する方法
マニホールド cf ベースの Windows ファイル共有コネクタを使用してファイルをクロールしています。ただし、Manifold CF は、読み取るすべてのファイルの lastAccessTime も更新します。
lastAccessTime を更新せずにすべてのファイルを読み取りたい。
Manifold CF のどのファイルを更新する必要がありますか?また、その方法を教えてください。