“solr”の関連問題_Stack Overflow日本語サイト

0 投票する

7 に答える

6672 参照

lucene - LuceneまたはSolrで使用するスパイダリングツールの推奨事項は？

HTMLおよびXMLドキュメント（ローカルまたはWebベース）に対して使用するのに適したクローラー（スパイダー）とは何ですか？Lucene / Solrソリューションスペースでうまく機能しますか？Javaベースである可能性がありますが、そうである必要はありません。

Bruno Tyndall

2008-11-12T00:50:36.407

0 投票する

4 に答える

2644 参照

lucene - リレーショナル DB から Lucene インデックスを構築するための一連のベストプラクティスはありますか?

LuceneやSolrを使用して、RDBMS を利用した Web アプリケーションで検索を提供することを検討しています。私にとって残念なことに、私がざっと調べたすべてのドキュメントは、インデックスからデータを取得する方法を扱っています。私は、有用なインデックスを構築する方法に関心があります。これを行うための「ベストプラクティス」はありますか?

lucene solr rdbms

Hank Gay

2008-11-17T18:07:29.563

0 投票する

2 に答える

1557 参照

solr - Xapian のクローラー/パーサー

一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。

Xapian は、検索エンジンライブラリに適しているように思えます。

Xapian と統合するためのクローラー/パーサーのオプションは何ですか?

Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?

solr web-crawler xapian

2008-12-01T23:52:05.357

0 投票する

3 に答える

5114 参照

regex - Solr: 正規表現フラグメントを使用して段落を抽出する

このメッセージを Solr メーリングリストに投稿しましたが、Solr の専門家が潜んでいる場合に備えて、ここでも試しています。

正規表現フラグメンタを使用しようとしていますが、必要な結果を得るのに苦労しています。単語の文字で始まり句読点で終わるフラグメントを取得しようとしていますが、何らかの理由で返されるフラグメントは非常に柔軟性がないように見えます。ここに私が使用している関連するパラメーターがあります。誰かが私が間違っている場所を指摘するのを助けることができるかもしれません:

これは、単語の文字で始まり、.!? のいずれかで終わる、400 ～ 600 文字の間で一致する必要があります。典型的な結果の例を次に示します。

. これらの写真をチェックしてください。木曜日、中国南西部で初めて展示された9匹のパンダの子。彼らは1歳未満です。彼らはつい最近授乳をやめました。中国中部の山林には 1,600 頭しか残っておらず、中国の繁殖施設や動物園には 120 頭しか残っていません。中国国外の動物園には約20頭いる。それらはほぼ完全に竹に存在します。彼らは30歳まで生きることができます。そして、これらの小さな人たちは、最終的にははるかに大きくなります. 彼らは成長するでしょう

ご覧のとおり、ピリオドで始まり単語文字で終わっています。フラグメントが思い通りに出てきて、正規表現はまったく何もしていないように見えますが、ギャップフラグメンタを使用すると結果が異なります。上記の結果では、前のピリオドと最後の 2 つの単語を削除してはならない理由がわかりません。スロップと正規表現パターンには十分な余地があります。私が間違っていることを理解するのを手伝ってください...

どうもありがとう、

マーク

regex solr highlighting

2008-12-12T22:01:41.337

0 投票する

1 に答える

2178 参照

solr - リクエストで送信された一連の資格情報に基づいて、Solr が異なるインデックスを参照するようにする簡単な方法はありますか?

その認証に使用される資格情報に基づいてさまざまなインデックスに対して動作する、ある種の認証によって保護されたSolrの単一のインスタンスが必要です。認証の種類は柔軟ですが、可能であれば、オープンスタンダード (既存または新しいもの) を使用したいと考えています。

私が解決しようとしている中心的な問題は、アプリケーションのさまざまなユーザーが (潜在的に) アプリケーションに格納されているさまざまなデータにアクセスできることであり、ユーザーはアクセスできないデータを検索できないようにする必要があります。各ユーザーのインデックスを構築することは、1 人のユーザーが禁止されたデータを表示しないことを保証する最も簡単な方法のようです。おそらく、もっと簡単な方法はありますか？Solr がユーザーをインデックスにマップする方法を用意する必要がなくなるものはありますか?

ありがとう。

solr

Hank Gay

2008-12-30T14:22:07.360

0 投票する

1 に答える

278 参照

ruby-on-rails - モデルを検索クエリとして使用する場合、acts_as_solrはデータベース内のすべての行を返します

このアプリケーションでは、検索にacts_as_solrを使用しています。モデル名を検索クエリとして使用すると、テーブル内のすべての行が返されるという事実を除いて、すべてがスムーズに実行されているようです。

たとえば、usersテーブルがあるとします。モデルでacts_as_solrを指定して、フィールドの名、姓を検索し、acts_as_solr：fields => [：handle、：lname、：fname]を処理します。検索語として「user」を使用すると、システム内のすべてのユーザー、または結果としてデータベース内のすべての行が返されます。

他の誰かがこれに遭遇しましたか？

ruby-on-rails ruby lucene solr

chris Chan

2009-01-16T19:07:17.470

0 投票する

2 に答える

3104 参照

python - solr予約キーワードをエスケープしてSolr検索

solrで予約されたキーワードを「：」として含むフィールドをクエリするにはどうすればよいですか？

例えば、

予約語「：」を含む「 http://www.example.com 」のエラーをスローします

python solr pysolr

Mohit Ranka

2009-02-21T07:46:45.043

0 投票する

1 に答える

334 参照

solr - Solr の奇妙な検索動作

フィールドを持つ多くのsolrドキュメントにインデックスを付けています

しかし、クエリで検索すると

ゼロの結果を返します。ただし、検索クエリは同様の他の uri (nntp://msnews.microsoft.com/microsoft.public.windows.windowsxp.general) でも機能します。

ここで何が欠けていますか？

solr pysolr

Mohit Ranka

2009-02-23T08:00:53.480

0 投票する

2 に答える

1358 参照

drupal - Drupal を介してクエリを実行すると、Apache Solr の結果が異なる – なぜ?

Drupalを使用してApache Solr用のカスタム検索インターフェイスを作成しようとしていますが、結果に奇妙な問題が発生しています。

同じクエリを Solr の組み込み Web インターフェイスから実行すると 8 ヒットになり、Drupal から実行すると 0 ヒットになりました。誰でも理由を説明できますか？

クエリは次のとおりです。どちらも Solr ログから取得したものです。

Solr バックエンド

INFO: [] webapp=/solr path=/select params={wt=standard&rows=10&start=0&explainOther=&hl.fl=&indent=on&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]&fl=*,score&qt=standard&version=2.2} hits=8 status=0 QTime=2
Drupal ApacheSolr モジュール

09-Mar-2009 15:37:31 org.apache.solr.core.SolrCore execute INFO: [] webapp=/solr path=/select params={wt=json&rows=10&json.nl=map&start=0&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]&version=1.2} hits=0 status=0 QTime=9

私の目にはみ出ているのはversion=1.2パラメーターだけですが、それを削除しようとしましたが、動作は変わりません。

多くの微調整の後、Drupal モジュールに多かれ少なかれ同じパラメーターを送信することができましたが、それでも結果は 0 です。

09-Mar-2009 17:47:43 org.apache.solr.core.SolrCore execute INFO: [] webapp=/solr path=/select params={wt=standard&rows=10&start=0&q=ss_cck_field_goal:sell+AND+ss_cck_field_type:(own+OR+coop+OR+house+OR+commercial)+AND+is_price:[10000+TO+5560000]} hits=0 status=0 QTime=13

誰でもこれを説明できますか？

drupal solr

mikl

2009-03-09T16:14:47.263

問題タブ [solr]

Reference