問題タブ [lucene]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - lucene.net がどのように機能するかについて、概要を教えてもらえますか?
MS SQL データベースがあり、次のvarchar
ようなクエリを実行したいフィールドが ありますwhere name like '%searchTerm%'
。しかし、現時点では、SQL エンタープライズの全文索引を使用しても遅すぎます。
Lucene .Net
誰かが私の状況をどのように助けることができるか説明できますか? インデクサーはどのように機能しますか? クエリはどのように機能しますか?
私のために何が行われ、私は何をしなければなりませんか?
linq-to-entities - Linq-to-Entities で lucene.net を使用した人はいますか?
誰かがこれを行った場合は、私に知らせてください。lucene.net については何も知りません。利用したことはありませんが、聞いたことはあります。そのようなものがLinqエンティティフレームワークとどのように統合されるのだろうと思っていましたか?
autocomplete - 誰かがファジークエリを LuceneDictionary ソリューションと比較できますか?
この投稿によると、「もしかして」機能を取得するには、LuceneDictionary を使用するのが最適です。しかし、この投稿を読む前に、おそらくファジー クエリを使用していたでしょう。今、どちらがより速く、どちらが実装しやすいのだろうかと思っています。
lucene - pom.xml.template は、プロジェクトを依存関係として使用するために知っておくべきことをすべて教えてくれますか?
term-highlighter というlucene サンドボックスの貢献を pom.xml に追加しようとしています。私はMavenにあまり詳しくありませんが、コードにはpom.xml.templateがあり、次のような依存関係を追加すると暗示されるようです:
それはうまくいくかもしれません。pom.xml ファイルに lucene-community プロジェクトを追加するのを手伝ってくれる人はいますか?
コメントありがとうございます。バージョンを追加するだけで十分であることがわかりました。使用していた lucene-core バージョンと一致するはずだと思いました。
lucene - 検索キーワードを強調表示する Lucene.Net 検索結果
Lucene.Net を使用していくつかのドキュメントのインデックスを作成しています。そのドキュメントが結果セットにある理由をユーザーに数行表示したいと思います。Google を使用して検索すると、リンクが表示され、その後にリンクが表示される場合と同じように、キーワードが強調表示された行がいくつか表示されます。何か案は?
lucene - Lucene.Net で同義語を使用する方法
シノニムと実際のキーワードを検索するには、lucene が必要です。つまり、「CI」を検索する場合、CI OR「統合を継続」を検索する必要があります。現時点では、同義語を持っているキーワードを検索し、それらを「OR-ed」バージョンに置き換えていますが、これを行うためのより良い方法があるはずです。私の方法は、「x AND y OR NOT z」のような複雑なクエリでは機能しません。
asp.net - Lucene.Net は、同じインデックスにアクセスする複数のスレッドを管理しますか?
ASP.NET で Lucene.Net を使用する場合、ある Web 要求がインデックスの更新をトリガーし、別の Web 要求が検索を実行していることが想像できます。Lucene.Net には、同時アクセスを管理する機能が組み込まれていますか?それとも、「別のプロセスによって使用されている」というエラーを回避するために管理する必要がありますか?
編集: ドキュメントと実験を読んだ後、これが私が学んだことだと思います: スレッドの安全性と同時実行性という 2 つの問題があります。マルチスレッドは、インデックスに悪いことを何もできないという点で「安全」です。ただし、一度に 1 つのオブジェクトがインデックスをロックするだけで安全です。2 番目のオブジェクトが来て、例外をスローします。したがって、検索を開いたままにして、別のスレッドのライターがインデックスを更新できると期待することはできません。また、スレッドがインデックスの更新でビジー状態の場合、サーチャーの作成は失敗します。
また、検索者は、インデックスを開いたときの状態でインデックスを見るので、インデックスを更新したままにしておくと、更新は表示されません。
検索者に最新の更新を見てもらいたかったのです。
私の設計は、これまでのところ機能しているように見えますが、現在の書き込みまたは検索が完了するまで、ライターとサーチャーが失敗しないようにロックを共有するというものです。
asp.net - Lucene.Netは、GetTempPath()を呼び出すため、ホストで失敗します。回避策は何ですか?
共有ホスト上のASP.NETアプリケーションでLucene.Netを使用しています。以下に示すこのスタックトレースを取得しました。回避策は何ですか?
[SecurityException:タイプ'System.Security.Permissions.EnvironmentPermission、mscorlib、Version = 2.0.0.0、Culture = neutral、PublicKeyToken =b77a5c561934e089'のアクセス許可の要求に失敗しました。]System.Security.CodeAccessSecurityEngine.Check(Object request、StackCrawlMark&stackMark 、ブールisPermSet)+0 System.Security.CodeAccessPermission.Demand()+59 System.IO.Path.GetTempPath()+54 Lucene.Net.Store.FSDirectory..cctor()+73
lucene - Lucene インデックス内のドキュメントのサブセットの上位用語を取得するにはどうすればよいですか?
Lucene インデックス内で上位の用語を取得できることはわかっていますが、Lucene インデックスのサブセットに基づいて上位の用語を取得する方法はありますか?
つまり、特定の日付範囲内のドキュメントのインデックスで上位の用語は何ですか?
.net - Java Lucene と .Net の統合
一部のサイトをクロールしてインデックス化するための Nutch と Lucene のセットアップがあり、nutch に付属の JSP サイトの代わりに .net Web サイトを使用したいと考えています。
誰かがいくつかのソリューションを推奨できますか?
.Net サイトがリモート処理を使用して接続するインデックス サーバーでアプリが実行されているソリューションを見てきました。
速度は明らかに考慮事項ですが、これでもうまく機能しますか?
編集: NHibernate.Search はこれで機能しますか?
編集: Solrnetライブラリを使用して、ASP.net サイトで使用されている Solr インデックス サーバーを使用することになりました。