問題タブ [lucene]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - Lucene をクエリ内のすべての単語と一致させるには?
Lucene を使用して、ユーザーが多数のドキュメント内の単語を検索できるようにしています。Lucene は、入力された単語のいずれかを含むすべてのドキュメントを返すようにデフォルト設定されているようです。
この動作を変更することは可能ですか? 「+」を使用して用語を強制的に含めることができることは知っていますが、それをデフォルトのアクションにしたいと思います。
理想的には、Google と同様の機能が必要です。「-」で単語を除外し、「abc xyz」で単語をグループ化します。
明確 にするために、クエリのすべてのスペースに「+」を挿入することも考えました。グループ化された用語 (括弧、引用符など) を検出してクエリを壊す可能性を避けたかっただけです。別のアプローチはありますか?
ruby-on-rails - モデルを検索クエリとして使用する場合、acts_as_solrはデータベース内のすべての行を返します
このアプリケーションでは、検索にacts_as_solrを使用しています。モデル名を検索クエリとして使用すると、テーブル内のすべての行が返されるという事実を除いて、すべてがスムーズに実行されているようです。
たとえば、usersテーブルがあるとします。モデルでacts_as_solrを指定して、フィールドの名、姓を検索し、acts_as_solr:fields => [:handle、:lname、:fname]を処理します。検索語として「user」を使用すると、システム内のすべてのユーザー、または結果としてデータベース内のすべての行が返されます。
他の誰かがこれに遭遇しましたか?
nhibernate - PostgreSQL 全文検索と Lucene.Net 経由の NHibernate.Search の比較
現在のプロジェクトで NHibernate.Search を選択するか、PostgreSQL の組み込み全文検索サポートを選択するかを検討しています。
ご想像のとおり、.NET プラットフォーム上で NHibernate ORM を備えた PostgreSQL RDBMS を使用しています。上記のフルテキスト エンジンについて、どのような経験がありますか? 注意すべき落とし穴はありますか?
java - Lucene 文検索
Lucene でSearching is funのような語句を検索することはできますか?
これで検索しようとすると、Lucene はfunという言葉だけを探してしまいます。
lucene - 先頭のワイルドカード文字が Lucene.NET でエラーをスローする
検索クエリの先頭にワイルドカード文字 (*
または?
)が含まれている場合、QueryParser
のParse
関数はエラーをスローします。
Lucene.NET v2.0.0.4 でこの問題を解決する方法はありますか?
vb.net - Lucene.NET インデックスを更新するには?
Lucene.NET (v2.0) を使用して、Visual Basic 9 (VS2008) でデスクトップ検索エンジンを開発しています。
次のコードを使用して IndexWriter を初期化します
同じドキュメント フォルダ (インデックスを作成するファイルを含む) を 2 回選択すると、そのドキュメント フォルダ内のファイルごとに 2 つの異なるエントリがインデックスに作成されます。
IndexWriter で、インデックスに既に存在するファイルをすべて破棄するようにします。
これを確実にするために何をすべきですか?
vb.net - インデックスのフィールドを使用してエントリを削除するにはどうすればよいですか?
Lucene.NETを使用してVB9でデスクトップ検索エンジンを開発しています
更新されたファイルの新しいエントリを削除して作成したいと思います。
インデックスには、完全なファイルパスと最終更新日が保存されます。
IndexReaderを使用して、ファイルがインデックスに存在するかどうかを確認しています(同じファイルのインデックスの再作成を回避するため)。
私は次の疑問を持っています:
フィールドの値を使用して
modified
、特定のファイルのインデックスエントリが古いかどうかを確認するにはどうすればよいですか?IndexReaderのどの機能でこれを実行できますか?関数deleteDocument()のドキュメント番号(docNum)を取得するにはどうすればよいですか?
search - HitCollector を使用して Lucene の結果をフィールド値で並べ替えるにはどうすればよいですか?
次のコードを使用して、Lucene.Net でクエリを実行しています。
これらの検索結果をフィールドに基づいて並べ替えるにはどうすればよいですか?
アップデート
ご回答ありがとうございます。使用してみましたが、引数値として渡したときにTopFieldDocCollector
エラーが発生しました。渡す有効な値を提案してください。"value is too small or too large"
5000
numHits
sql-server - SQL Server 2008 全文検索 (FTS) と Lucene.NET の比較
過去に SQL 2005 と Lucene.NET について質問があったことは知っていますが、2008 年以降、SQL 2005 に多くの変更が加えられたため、長所/短所 (または記事へのリンク) を教えてくれる人がいるかどうか疑問に思っていました。