問題タブ [solr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - LuceneまたはSolrで使用するスパイダリングツールの推奨事項は?
HTMLおよびXMLドキュメント(ローカルまたはWebベース)に対して使用するのに適したクローラー(スパイダー)とは何ですか?Lucene / Solrソリューションスペースでうまく機能しますか?Javaベースである可能性がありますが、そうである必要はありません。
solr - Xapian のクローラー/パーサー
一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。
Xapian は、検索エンジン ライブラリに適しているように思えます。
Xapian と統合するためのクローラー/パーサーのオプションは何ですか?
Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?
regex - Solr: 正規表現フラグメントを使用して段落を抽出する
このメッセージを Solr メーリング リストに投稿しましたが、Solr の専門家が潜んでいる場合に備えて、ここでも試しています。
正規表現フラグメンタを使用しようとしていますが、必要な結果を得るのに苦労しています。単語の文字で始まり句読点で終わるフラグメントを取得しようとしていますが、何らかの理由で返されるフラグメントは非常に柔軟性がないように見えます。ここに私が使用している関連するパラメーターがあります。誰かが私が間違っている場所を指摘するのを助けることができるかもしれません:
これは、単語の文字で始まり、.!? のいずれかで終わる、400 ~ 600 文字の間で一致する必要があります。典型的な結果の例を次に示します。
. これらの写真をチェックしてください。木曜日、中国南西部で初めて展示された9匹のパンダの子。彼らは1歳未満です。彼らはつい最近授乳をやめました。中国中部の山林には 1,600 頭しか残っておらず、中国の繁殖施設や動物園には 120 頭しか残っていません。中国国外の動物園には約20頭いる。それらはほぼ完全に竹に存在します。彼らは30歳まで生きることができます。そして、これらの小さな人たちは、最終的にははるかに大きくなります. 彼らは成長するでしょう
ご覧のとおり、ピリオドで始まり単語文字で終わっています。フラグメントが思い通りに出てきて、正規表現はまったく何もしていないように見えますが、ギャップ フラグメンタを使用すると結果が異なります。上記の結果では、前のピリオドと最後の 2 つの単語を削除してはならない理由がわかりません。スロップと正規表現パターンには十分な余地があります。私が間違っていることを理解するのを手伝ってください...
どうもありがとう、
マーク
solr - リクエストで送信された一連の資格情報に基づいて、Solr が異なるインデックスを参照するようにする簡単な方法はありますか?
その認証に使用される資格情報に基づいてさまざまなインデックスに対して動作する、ある種の認証によって保護されたSolrの単一のインスタンスが必要です。認証の種類は柔軟ですが、可能であれば、オープン スタンダード (既存または新しいもの) を使用したいと考えています。
私が解決しようとしている中心的な問題は、アプリケーションのさまざまなユーザーが (潜在的に) アプリケーションに格納されているさまざまなデータにアクセスできることであり、ユーザーはアクセスできないデータを検索できないようにする必要があります。各ユーザーのインデックスを構築することは、1 人のユーザーが禁止されたデータを表示しないことを保証する最も簡単な方法のようです。おそらく、もっと簡単な方法はありますか?Solr がユーザーをインデックスにマップする方法を用意する必要がなくなるものはありますか?
ありがとう。
ruby-on-rails - モデルを検索クエリとして使用する場合、acts_as_solrはデータベース内のすべての行を返します
このアプリケーションでは、検索にacts_as_solrを使用しています。モデル名を検索クエリとして使用すると、テーブル内のすべての行が返されるという事実を除いて、すべてがスムーズに実行されているようです。
たとえば、usersテーブルがあるとします。モデルでacts_as_solrを指定して、フィールドの名、姓を検索し、acts_as_solr:fields => [:handle、:lname、:fname]を処理します。検索語として「user」を使用すると、システム内のすべてのユーザー、または結果としてデータベース内のすべての行が返されます。
他の誰かがこれに遭遇しましたか?
python - solr予約キーワードをエスケープしてSolr検索
solrで予約されたキーワードを「:」として含むフィールドをクエリするにはどうすればよいですか?
例えば、
予約語「:」を含む「 http://www.example.com 」のエラーをスローします
solr - Solr の奇妙な検索動作
フィールドを持つ多くのsolrドキュメントにインデックスを付けています
しかし、クエリで検索すると
ゼロの結果を返します。ただし、検索クエリは同様の他の uri (nntp://msnews.microsoft.com/microsoft.public.windows.windowsxp.general) でも機能します。
ここで何が欠けていますか?
drupal - Drupal を介してクエリを実行すると、Apache Solr の結果が異なる – なぜ?
Drupalを使用してApache Solr用のカスタム検索インターフェイスを作成しようとしていますが、結果に奇妙な問題が発生しています。
同じクエリを Solr の組み込み Web インターフェイスから実行すると 8 ヒットになり、Drupal から実行すると 0 ヒットになりました。誰でも理由を説明できますか?
クエリは次のとおりです。どちらも Solr ログから取得したものです。
Solr バックエンド
INFO: [] webapp=/solr path=/select params={wt=standard&rows=10&start=0&explainOther=&hl.fl=&indent=on&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]&fl=*,score&qt=standard&version=2.2} hits=8 status=0 QTime=2
Drupal ApacheSolr モジュール
09-Mar-2009 15:37:31 org.apache.solr.core.SolrCore execute INFO: [] webapp=/solr path=/select params={wt=json&rows=10&json.nl=map&start=0&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]&version=1.2} hits=0 status=0 QTime=9
私の目にはみ出ているのはversion=1.2
パラメーターだけですが、それを削除しようとしましたが、動作は変わりません。
多くの微調整の後、Drupal モジュールに多かれ少なかれ同じパラメーターを送信することができましたが、それでも結果は 0 です。
09-Mar-2009 17:47:43 org.apache.solr.core.SolrCore execute INFO: [] webapp=/solr path=/select params={wt=standard&rows=10&start=0&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]} hits=0 status=0 QTime=13
誰でもこれを説明できますか?