問題タブ [full-text-indexing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2848 参照

search - 空白と句読点をトークン化するように Solr を設定するにはどうすればよいですか?

Solr スキーマ (Solr 1.3.0 を使用) を取得して、空白と句読点でトークン化された用語を作成しようとしています。以下に、私が望んでいることの例をいくつか示します。

この組み合わせがうまくいくと思いました:

問題は、これにより文字から数字への遷移が次のようになることです。

さまざまな設定の組み合わせを試しWordDelimiterFilterFactoryましたが、有用であると証明されたものはありません。必要なものを処理できるフィルターまたはトークナイザーはありますか?

0 投票する
1 に答える
167 参照

java - Hibernate Search で同じインデックス ファイルを使用する 2 つのアプリケーション

2 つのアプリケーションでエンティティに同じインデックス ファイルを使用できるかどうかを知りたいです。もっと具体的に言ってみましょう:

ユーザー用のフロントエンドとバックエンド タスク用のアプリケーション (= 管理者インターフェイス) を備えたオンライン アプリケーションがあります。どちらも同じ JBOSS AS で実行されています。両方のアプリケーションが同じデータベースを使用しているため、同じエンティティを使用しています。もちろん、パッケージ名はエンティティの両方のアプリケーションで同じではありません。

これが私たちのユースケースです: ユーザーはフロントエンドを介して検索できる必要があります。ユーザーは、「visible」でタグ付けされた結果のみを表示できます。このタグ付けは管理インターフェイスで行われるため、エンティティがバックエンドで「可視」とタグ付けされるたびに、フロントエンドのインデックスを更新する必要があります。

もちろん、両方のアプリケーションに同じインデックス ルート フォルダーがあります。私のインデックス フォルダには 2 つのインデックス ファイルがあります。

de.xxadmin.model.Product de.xxfrontend.model.Product

Hibernate Search 構成を介してこれを「マージ」する方法は? 私はちょうどドキュメントを介してそれを取得しませんでした...

助けてくれてありがとう!

0 投票する
2 に答える
1408 参照

postgresql - postgre全文検索から正しい結果を得ることができません

私はブラジルのポルトガル語で簡単な記事のウェブサイトを開発しています。検索機能は全文検索に基づいていますが、期待どおりの結果が返されません。

私はpostgresqlでこれを作りました。簡略化した表は次のとおりです。

テーブルを作成した後、次のコマンドを実行しました。

はい、検索には単純な重み付けを使用するつもりです。高速化するためのインデックス、トリガーを作成したので、インデックスの再作成などを気にせずに挿入および更新できます。

まあ、私の理解によれば、それはすべて問題ありません。しかし、結果はそうではありません。簡単な例。

1つの記事のコンテンツとして「... bancode dados ... nobanco...」があるとします。私がする時:

空のセットを返します。ts_vector列を確認し、述語「banc」と「dad」を確認しました。しかし、なぜそれが言及された記事を含む行を返さないのか理解できません。

誰かがこの質問に光を当てることができますか?

0 投票する
1 に答える
1790 参照

mysql - MySQL フルテキスト インデックスはどれくらいの追加ストレージを消費しますか?

MySQL TEXT カラムがフルテキスト インデックスを取得する場合に必要となる追加ストレージの量を見積もる方法を探しています。

直観的に言えば、フルテキスト インデックスのサイズはテキストの全長に依存しますが、正確には何が影響しているのでしょうか?

0 投票する
4 に答える
309 参照

asp.net - Web サイトをインデックス化する方法

誰かに代わって聞いているので、詳細はわかりません。

ASP.NET Web サイトでサイト コンテンツのインデックス作成に使用できるオプションは何ですか? ページのコンテンツがデータベースに保存されている場合、SQL Server のフル テキスト インデックスが使用されているのではないかと思います。コンテンツが DB に保存されていない場合、動的コンテンツと静的コンテンツのインデックスを作成するにはどうすればよいですか?

0 投票する
2 に答える
1242 参照

python - App Engine で全文検索を行うにはどうすればよいですか?

App Engine でできるだけ少ない作業で高速な全文検索を行うにはどうすればよいですか (Java を最小限に抑えます。私は Python を使用しています)。

0 投票する
1 に答える
227 参照

sql - フルテキスト インデックスからファイルの種類を除外する

varbinary(max) filestream 列にフルテキスト インデックスを作成しました。PDF と XML の両方がこのファイルストリームに保存されているため、両方がインデックス化されています。ただし、時間が経つにつれてインデックスが肥大化して速度が低下するのではないかと心配しているため、XML ファイルにインデックスを付けたくありません。したがって、私が本当にやりたいことは、代わりに PDF ファイルに全文索引のみを配置することです。これを行う方法はありますか?どうにかして XML フィルターを無効にすることはできますか?

0 投票する
1 に答える
303 参照

sql-server - Windows Server 2008 で実行されている SQL Server 2000 フル テキスト インデックス

Windows Server 2008 で SQL Server 2000 SP4 を実行しており、いくつかのテーブルのフル テキスト インデックスを含むフル テキスト カタログを作成しようとしています。カタログのアイテム数は 53676 ですが、一意のキー数は 8 しかありません。

まったく同じデータを持つ別のデータベース (Windows Server 2003 マシン) では、まったく同じフル テキスト カタログがセットアップされており、一意のキー カウントは 75312 です。

一意のキー数が非常に少ない原因は何ですか?

0 投票する
1 に答える
188 参照

sql-server-2008 - Sql Server 2008 に全文索引システム ビューがありません

システムビューについて読んでいます:sys.dm_fts_index_keywords_by_document msdnで、2008年のデータベースでビューが見つかりません。デフォルトでそこにあるべきかどうか誰でも知っていますか?

0 投票する
1 に答える
2295 参照

indexing - luceneでネガティブクエリブーストを使用することは可能ですか?

クエリ内のいくつかの用語にペナルティを課したいのですが、それらをまったく無視しないので、「MUSTNOT」演算子は機能しませんか?luceneのブールクエリでSHOULDを使用してネガティブクエリブーストを使用することは可能ですか?どのように機能しますか?