問題タブ [lucene]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - lucene の検索結果に最新のコンテンツを表示する
lucene インデックスにさまざまな記事を保存しています。ユーザーが特定の用語またはフレーズを含む記事を検索する場合、すべての記事 (1000 から 10000 の記事の範囲) を表示する必要がありますが、検索結果には最新の記事が「バブルアップ」されています。
「日付フィールドブースティング」を使用して、Lucene で検索結果をバブルアップできると思います。誰かがこれについての詳細を教えてもらえますか?
前もって感謝します!
lucene - 検索クエリの最適化
ストア検索に Lucene.net (バージョン 2.0.0.4) を使用する Web アプリケーションに取り組んでいます。私の Web アプリケーション ユーザーは、特定の場所から 50 マイル以内にある米国内の店舗を検索できます。サードパーティ API を使用して、半径内のすべての都市を検索しています。ニュージャージー州エジソンなどの都市では、40 マイル以内に約 450 の都市が見つかります (API は 450 の都市を含む .Net ハッシュテーブルを返します)。このハッシュテーブルを繰り返し処理することで、BooleanQuery/Query クラスを使用して lucene クエリを構築しています。
このシナリオでは、lucene を介して検索結果をビルド、実行、および返すのに多くの時間がかかっていることがわかりました。このコードを最適化する方法はありますか??
ありがとう!
lucene - 複数の異なる値を持つフィールド
Lucene を使用して「書籍検索」API を構築しています。Lucene インデックスの Book Name、Author、および Book category フィールドにインデックスを付ける必要があります。
1 つの本が複数の異なる本のカテゴリに分類される場合があります。たとえば、次のようになります。
BookName1 --フィクション、ユーモア、哲学。BookName1 --フィクション、サイエンス。BookName1 -- ユーモア、ビジネス。BookName4-ユーモアなど……。
ユーザーは、「ホモ」などの特定のカテゴリにあるすべての本を検索できる必要があります。
この状況を考えると、どのようにフィールドの上にインデックスを作成し、lucene でクエリを作成するのですか?
lucene - Lucene クエリの最適化に関するアドバイスが必要
Lucene を使用して Web ベースの求人検索アプリケーションに取り組んでいます。私のサイトのユーザーは、「マサチューセッツ州ボストン」またはその他の場所から半径 100 マイル以内の求人を検索できます。また、「関連性」(つまり、lucene によって返されるスコア) で並べ替えられた検索結果を降順に表示する必要があります。
サードパーティ API を使用して、指定された都市の半径内にあるすべての都市を取得しています。この API は、「マサチューセッツ州ボストン」から半径 100 マイル以内にある約 864 の都市を返します。
「BuildNearestCitiesQuery」メソッドの一部である次のロジックを使用して、都市/州の Lucene クエリを作成しています。ここで NearestCities は上記の API によって返されたハッシュテーブルです。CityName as キーと StateCode を値として持つ 864 の都市が含まれています。また、finalQuery は Lucene BooleanQuery オブジェクトであり、スキル、キーワードなど、ユーザーが入力した他の検索条件が含まれています。
次に、finalQuery オブジェクトを Lucene の Search メソッドに入力して、半径 100 マイル以内のすべての求人を取得します。
この BuildNearestCitiesQuery メソッドの実行には、平均でなんと 29 秒もかかることがわかりました。これは、Web サイトの標準では明らかに受け入れられません。ステートメント。
特定の場所の求人は動的な属性であり、都市には今日 2 つの求人 (特定の検索基準を満たす) がある可能性がありますが、3 日後には同じ検索基準の求人はありません。そのため、「キャッシュ」は使用できません。こっち。
このロジックを最適化する方法はありますか?それとも、Lucene を使用して 100 マイル以内にあるすべてのジョブを見つけるためのアプローチ/アルゴリズム全体を最適化する方法はありますか?
参考までに、Lucene でのインデックス作成は次のようになります。
読んでくれて本当にありがとう!
ジャニス
hibernate - nHibernate v2 で nHibernate.Search
nHibernate.Search を取得してインデックスを作成するのに問題があります。
nHibernate.dll & nHibernate.Search.dll の 1.2.1.4 を使用すると、インデックスが正しく作成され、Luke (Lucene ユーティリティ) で検査できます。セグメント ファイルとフラグメント ファイルなどが作成されます。
ただし、nHibernate.dll & nHibernate.Search.dll の v 2 を使用すると、インデックスが正しく作成されません。Index ディレクトリには 1k セグメント ファイルのみが作成され、Luke はそれを調べることができません。
v1 で使用したコードは次のとおりです。
そして、設定ファイルに次のものがあります
バージョン 2 には SearchFactory がありません。私が見つけた唯一の同様のものは
だから私は次のように構成を設定しました
これにより、インデックスの最低限の骨が作成されますが、ルークでは表示できません-破損していることがわかります
また、次のコードを使用してインデックスを手動で作成しようとしましたが、ここでもセグメント ファイルのみが作成され、他には何も作成されません。
私の質問は、nHibernate.Search を使用したい場合、nHibernate の v1.1.4 を使用する必要がありますか? または、v2 を使用できますか? どのような場合、私は何を間違っていますか?
これについては、ウェブ上にはほとんどありません。
誰?
lucene - これらの単語はすべて特徴的です
Lucene でインデックス化された「説明」フィールドがあります。このフィールドには、本の説明が含まれています。BooleanQuery クラスを使用して、このフィールドで「これらのすべての単語」機能を実現するにはどうすればよいですか? たとえば、ユーザーが「売れ筋の本」と入力した場合、説明にこれらすべての単語が含まれる本を返す必要があります。
ありがとう!
lucene - 正確なフレーズの検索
BooleanQuery/その他のクラスを使用して、このフィールドで「正確なフレーズ」機能を実現するにはどうすればよいですか? たとえば、ユーザーが「売れ筋の本」と入力すると、説明にこのフレーズが含まれる本が返されます。
再度、感謝します!
java - Lucene インデックス内のドキュメント数の検索
Lucene の Java バージョンを使用して、インデックス内のドキュメントの数をどのように確認しますか?
lucene - Lucene インデックスの更新とパフォーマンス
私は求人ポータル サイトに取り組んでおり、求人検索機能に Lucene を使用しています。ユーザーは毎日、多数の仕事をサイトに投稿します。投稿された新しい仕事ができるだけ早くサイトで検索できるようにする必要があります。このコンテキストでは、新しい求人が投稿されたとき、または既存の求人が編集されたときに Lucene インデックスを更新するにはどうすればよいですか? lucene インデックスの更新と検索は並行して実行できますか?
また、Lucene のインデックス作成、最適化、パフォーマンスなどに関するヒントやベスト プラクティスを教えてください。
あなたの助けに感謝します!
ありがとう!