問題タブ [exact-match]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
98 参照

solr - Can Exact Match and StopwordsFilter mix in Solr

I'm rephrasing my earlier question. Hoping someone will be able to help.

I currently have a solr implementation that do exact matching only.

Therefore, a search phrase of "THE TEST" will match only to "THE TEST"

However, I've also implemented pattern replace filter.

So a search phrase of "TOM AND JERRY" will match with "TOM & JERRY".

Now, we want to add stopwordsfilter. We want to remove "THE" during indexing.

Therefore, a search phrase of "TEST" will match with "THE TEST".

I change the tokenizer from KeywordTokenizerFactory to Whitespacetokenizerfactory. However, the search result blew up.

Although "TEST" is now matching with "THE TEST". It also matched with "EVEL TEST" and etc.

Is there a way to avoid the test phrase from matching with evel test and etc?

Help is very much appreciated. Thanks.

Below is my current index analyzer

0 投票する
1 に答える
17056 参照

solr - 完全一致を含むテキストに対する SOLR 完全一致ブースト

より良いタイトルが見つかりませんでした。可能であれば、最終的な提案に基づいて後で変更したいと考えています。

私の問題:

音楽アーティストのデータベースを取得しました。これらは次のようになります: 「dr. dre feat. akon」、「eminem & dr. dre」、「dr. dre feat. ll cool j」、「dr. dre」、「dr. dre feat. eminem & skylar gray」 . id と name の 2 つのフィールドしかありません。

デフォルトのスキーマ solr コアで、「q=dr. dre」というクエリを実行すると、結果は問題ありませんが、完全ではありません。次のようになります。

  • 博士。ドレ feat. エイコン
  • エミネム & Dr. ドレ
  • 博士。ドレ feat. クールなj
  • 博士。ドレ
  • ...

彼らはまったく同じスコアを得たことに注意してください。

私が望むのは、次のように、最初の結果として「dr. dre」を取得し、次に他のすべての結果を取得することです。

  • 博士。dre <<-- 博士。ドレが最初
  • エミネム & Dr. ドレ
  • 博士。ドレ feat. クールなj
  • 博士。ドレ feat. エイコン
  • ...

どうすればこれを達成できますか? (フィルター、トークナイザー、フィールドのコピーなどは重要ではありません。他のフォーラムで提案されているように、solr内のコードを変更することはできません)

ありがとう。

0 投票する
3 に答える
2479 参照

c# - XPath を使用した文字列の完全一致

Selenium c# を使用して Web ページから要素をスクレイピングするための xpath を作成しました。

ここにXPathがあります

の重複が見つかるまで、これは正常に機能していmatch textます。したがって、Webページには2つの要素があり、match text

1つともう1match textmatch text 9000

これで、 をクリックするだけで済みmatch textます。だから、私は次のXPathを書きました

Web ページでは、一致テキストの先頭にスペースがあることに注意してください。上記の Xpath は機能しませんでした。Fire PathFirefoxの拡張機能でこれを確認しました。

の正確な一致を見つける Xpath を提案してくれる人はいますかmatch text。一致テキストには、任意の数の先行スペースを含めることができると想定します。

も使用してみましたnormalize-space()が、どちらもうまくいきませんでした。これは私が試したものです

SOでいくつかの質問を見つけましたが、役に立ちませんでした。

あなたの助けに感謝。

アップデート:

あなたの答えに感謝しますが、どれも私にとってはうまくいきませんでした。

また、これらの2つの文字列についても言及しました

  • マッチテキスト
  • 一致テキスト 9000

私のコードでは、foreach ループでそれらを繰り返します。したがって、2 番目の要素として 9000 を取得できるとは限りません。

Firefox の FirePath 拡張機能を使用して、言及されているすべての回答を試しましたが、Web ページで何も選択されていません。

前述のように、一致テキストの前にスペースを挿入しました。

HTML: (xpath に一致させるため)

これは私のページの HTML で、&nbsp;文字が含まれています。の前に2&nbsp;文字と追加のスペースがありmatch textます。要素をスクレイピングしているサイトはクライアント サイトです。HTML を変更するように彼に言うことはできません。

0 投票する
1 に答える
1282 参照

search - 完全なインデックス付きデータを使用したクエリのApache solr完全一致

私はsolr 4.8を使用しています。非常に基本的な質問があります。ドキュメントの「I am in class」などの文字列を含むフィールドがあり、2 番目のドキュメントの値が「class」であるとします。今、私は格納された文字列と正確に一致させたいと思っています。つまり、ユーザーがクラスを検索すると、これら 2 つの文字列が等しいため、2 番目のドキュメントが返されます。私のクエリとその値が正確に一致しないため、最初のドキュメントを返すべきではありません。

私はApache solrで同じことを達成したい。それを実装する方法。

0 投票する
1 に答える
1277 参照

elasticsearch - ElasticSearch: edge_ngram と fuzziness による部分的/正確なスコアリング

ElasticSearch では、edge_ngram をファジーで使用して正しいスコアリングを取得しようとしています。完全一致のスコアを最高にし、サブ マッチのスコアを低くしたいと考えています。以下は、私のセットアップとスコアリングの結果です。

ファーストネーム「Michael」で POST を実行した後、「Michael」、「Michae」、「Micha」、「Mich」、「Mic」、および「Mi」を変更して、以下のようにクエリを実行します。

私のスコア結果は次のとおりです。

ご覧のとおり、スコア結果は期待どおりに得られていません。「Michael」を最高点、「Mi」を最低点にしたいと思います

どんな助けでも大歓迎です!

0 投票する
1 に答える
940 参照

search - Algolia インデックスで正確な用語を検索する

属性の正確な値でインデックスをフィルター処理したいと考えています。Algolia はそのためにどのような可能性を提供してくれるのだろうか。

インデックスをクエリすると、常に部分文字列が検索されます。つまり、検索語abcは、属性値に含まれるすべてのオブジェクトと常に一致しますabc。私が達成したいのは、属性の値としてabcのみ検出される検索abcです (この場合、検索する特定の属性があります)。

私が思いついた 1 つの可能性はタグ付けでしたが、これは最善の方法とは思えません。

編集

ファセット フィルターも使用できると思います。私はさまざまな長所と短所について考えましたが、どちらか一方の立場を他方の上に置く議論を思いつくことはできません.