問題タブ [lucene]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - Solr で Nutch クローラーを使用する
Apache Nutch クローラーを Solr Index サーバーと統合できますか?
編集:
私たちの開発者の 1 人が、これらの投稿から解決策を思いつきました
答え
はい
lucene - クエリのロギング/分析用の Solr フィルター
私は Solr を使用しており、クエリ/トークンをデータベースに記録して、マーケティングと提案された検索機能の両方を分析できるようにしたいと考えています。
Lucene フィルターがこれを行う良い方法であると推測しています。おそらく、指定されたデータベースにログを記録する特定のフィールド タイプのクエリ フィルター チェーンにフィルターを配置します。Solr の応答時間への影響を最小限に抑えるために、これを行う最善の方法を考えています。
過去にこれを行ったことがあり、解決策を喜んで共有してくれる人がいれば、それは素晴らしいことです。
lucene - Lucene、Solr、または Nutch を使用して単純な検索エンジンを作成するにはどうすればよいでしょうか?
当社には何千もの PDF ドキュメントがあります。Lucene、Solr、または Nutch を使用して単純な検索エンジンを作成するにはどうすればよいでしょうか? 基本的な Java/JSP Web ページを提供します。ユーザーは単語を入力して基本的なクエリを実行し、一致するすべての PDF のドキュメント リンクを表示できます。
c# - Web アプリケーションで IndexSearcher/IndexWriter を使用する Lucene.net
私は現在、Web アプリケーションで Lucene.net を実行していますが、パフォーマンスに関して最善の方法を考えています。
現在、インデックスの最適化とともに、すべてのインデックス書き込みがスケジュールされたプロセスでまとめて処理されるように設定しています。
ただし、検索については、現在、検索ごとにサーチャーを開いたり閉じたりしていますが、これは理想的ではないことがわかっています。
この状況では、どのようなアプローチが最善だと思いますか?
更新/最適化が処理されたら、インデックス サーチャーを閉じて再度開く必要があるため、スケジュールされたプロセス (Windows コンソール アプリ) は、完了したことを Web アプリケーションに通知する必要があります。
java - .net で Lucene をどのように実行しますか?
Lucene は優れた検索エンジンですが、.NET バージョンは公式の Java リリースよりも遅れています (最新の安定した .NET リリースは 2.0 ですが、最新の Java Lucene バージョンは 2.4 で、より多くの機能があります)。
これをどのように回避しますか?
java - 注釈付きハイバネートを使用したコンパスの構成
JavaベースのWebアプリケーションにHibernateを使用しており、Compassを介して全文検索を追加したいと考えています。Compassはそれをサポートすることになっていますが、有用な入門ガイドを提供していません。
エンティティに@Searchableとさまざまな@SearchableXXXバリエーションで注釈を付け、HibernateHelper.getCompass(sessionFactory)を介してサービスコードのCompassにアクセスする必要があることがわかりました。
「コンパスイベントリスナーが構成されていません。リファレンスドキュメントとアプリケーションのhibernate.cfg.xmlを確認してください」というHibernateExceptionが発生します。
SpringのAnnotationSessionFactoryBeanを使用してHibernateを構成している間、リファレンスドキュメントは再びヒントとhibernate.cfg.xmlを示します。その場合、ドキュメントには次のように記載されています。「HibernateAnnotationsまたはHibernateEntityManager(JPA)が使用されている場合、Compass jarファイルをクラスパスにドロップするだけで有効になります(クラスパスでHibernateSearchが使用されていないことを確認してください。同じイベントクラス名)。」それは私にはうまくいきません。
私が見逃しているアイデアや、始めるための良いリソースはありますか?
lucene - Lucene QueryParser をより寛容にする方法は?
私は Lucene.net を使用していますが、API は同じであり、両方のプラットフォームに解決策があることを望んでいるため、.NET と Java の両方のバージョンについてこの質問にタグを付けています。
他の人がこの問題に取り組んでいると確信していますが、良い議論や例を見つけることができませんでした.
デフォルトでは、Lucene はクエリ構文について非常にうるさいです。たとえば、次のエラーが発生しました。
ユーザーからのクエリを処理するときに ParseExceptions を防ぐ最善の方法は何ですか? 最も使いやすい検索インターフェースは、たとえそれが間違ったクエリーであったとしても、常にクエリーを実行するものだと私には思えます。
考えられる補完的な戦略がいくつかあるようです。
- クエリを QueryProcessor に送信する前に「クリーン」にする
- 例外を適切に処理する
- ユーザーにインテリジェントなエラー メッセージを表示する
- おそらく、より単純なクエリを実行して、エラーのあるビットを除外します
これらの戦略をどのように実行するかについて、私は本当に素晴らしいアイデアを持っていません。他の誰かがこの問題に対処しましたか? 私が知らない「シンプル」または「優雅な」パーサーはありますか?
php - Zend Framework - ビューから静的コンテンツにインデックスを付けるスクリプトはありますか?
Zend Framework 1.6 を使用して構築された自分の Web サイトに、Zend Search Lucene を使用して検索ボックスを追加したいと考えています。私のコンテンツの大部分は静的であり、コントローラー ビュー内に保持されます。
ビューのコンテンツにインデックスを付けて、検索できるように Lucene 検索データベースに追加できるスクリプトを持っている人はいますか?
どうもありがとう、
マット
lucene - Solrクエリで特定のフィールドを取得しますか?
JettyでSolrインスタンスを実行していますが、Solr管理パネルを使用して検索すると、ドキュメント全体が返されます。検索によって返された各Solrドキュメントから指定されたフィールドのみを取得するにはどうすればよいですか?
c# - Lucene での複数のテーブルのインデックス作成
lucene.net を使用して、データベース内のレコードのインデックスを作成したいと考えています。レコードは複数の異なるテーブルに格納され、レコード テーブルを通じて結合されます。各テーブルに個別にインデックスを作成し、検索結果をコードで結び付ける方がよいでしょうか。それとも、データベースから出てくるレコードを結び付けて、すべてを 1 つのインデックスに配置する必要がありますか?
他の提案も同様に役立ちます。