“shingles”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

345 参照

java - 同義語フィルターとシングルフィルターを一緒に使用するには?

shingleフィルターでフィルターを使用しようとしていsynonymます (以下のコードを参照)。これにより、出力が得られます。

実施された

のために実装された

検査用

検査試験

enforcedとimplementedはとと同じようtestingに一緒に出現しexaminationます。次の出力を取得することは可能ですか?

強制される

のために実装された

検査用

テスト用

JSON 定義

2014-09-07T14:46:30.710

0 投票する

0 に答える

292 参照

search - Solr MultiPhraseQuery が正しい結果を返さない

部分文字列の Solr 検索の作成に問題があります。たとえば、ユーザーが「Alfa Romeo Land Car」を検索する場合、完全なブランド ( 「Land Rover」ではなく「Alfa Romeo」のみ) のみを一致させたいと考えています。これを行う方法は、クエリから帯状疱疹を作成し、「車のブランド」Solr コアと完全に一致させようとすることです。

したがって、ユーザーが「AB C」を検索した場合、帯状疱疹 [A、AB、ABC、B、BC、C] を取得したいと考えています。

しかし、以下の Solr 構成を使用すると、(EDisMax または標準クエリパーサーを使用して)「AB C」を検索すると、Solr は何も返しませんが、「ABC」を検索すると、一致する結果「ABC」が得られます。

これが私のschema.xmlファイルです：

私のSolrコアのドキュメントは次のとおりです。

Solr 管理 Web ページで、[Schema Browser] に移動し、問題のフィールドを選択して [Load Term Info] を押すと、次の索引付けされた用語が表示されます。

「AB C」を検索すると、次の帯状疱疹 [ABC AB BC ABC] が必要ですが、デバッグクエリからは次のようになります。

問題はMultiPhraseQueryに関連している可能性があると思います。正しいシングルのように見えるものを作成しますが、Solr はこれらの文字列を検索しないようです。私が欠けているものを誰か知っていますか？

事前にどうもありがとう

search solr shingles

2016-01-29T01:12:25.583

0 投票する

2 に答える

936 参照

solr - 複数の solr トークンを 1 つに連結する方法

Solr では、solr.ShingleFilterFactory を使用してトークンをマージすると、min/maxShingleSize とマージするトークンに応じて、複数のシングルが生成される場合があります。このため、検索に失敗します。検索が機能するように、複数のトークンを 1 つにマージするにはどうすればよいですか。ここに私の設定があります：

クエリ name_ngram:"our G20 9NS" のデバッグ出力は次のとおりです。

事前にサンクス、

solr token postal-code shingles

2016-01-31T03:19:43.997

0 投票する

1 に答える

330 参照

solr - デバッグクエリで Solr シングルが表示されない

Solr を使用して、ユーザー検索でカテゴリの完全一致を見つけようとしています(e.g. "skinny jeans" in "blue skinny jeans")。次の型定義を使用しています。

このタイプは、トークン化せずにカテゴリをインデックス化し、空白をアンダースコアに置き換えるだけです。ただし、クエリをトークン化し、それらをシングル化します (アンダースコアを使用)。

私がやろうとしているのは、クエリのシングルをインデックス付きのカテゴリと照合することです。Solr 分析ページでは、空白/アンダースコアの置換がインデックスとクエリの両方で機能し、クエリが正しくシングル化されていることがわかります (下のスクリーンショット)。

私の問題は、Solr クエリページで帯状疱疹が生成されているのを確認できないことです。その結果、「スキニージーンズ」というカテゴリは一致せず、「ジーンズ」というカテゴリは一致していると推測されます :(

これはデバッグ出力です:

parsedquery パラメーターがシングルクエリを表示しないことは明らかです。インデックス付きの値に対してクエリシングルを照合するプロセスを完了するには、何をする必要がありますか? この問題の解決に非常に近づいているように感じます。どんなアドバイスでも大歓迎です！

solr token n-gram solr-schema shingles

2016-05-25T10:07:05.340

0 投票する

1 に答える

1036 参照

java - Hadoop の ClassNotFoundException

Hadoop mapreduce を使用して、さまざまな長さの部分文字列を取得するコードを書いています。例として、文字列「ZYXCBA」と長さ 3 を指定します。私のコードは、長さ 3 (「ZYX」、「YXC」、「XCB」、「CBA」)、長さ 4 (「ZYXC」、「YXCB」、 "XCBA") 最後に長さ 5 ("ZYXCB","YXCBA")。

マップフェーズでは、次のことを行いました。

キー = 必要な部分文字列の長さ

値 = "ZYXCBA"。

したがって、マッパーの出力は

reduce では、文字列 ("ZYXCBA") とキー 3 を使用して、長さ 3 のすべての部分文字列を取得します。4,5 についても同じことが起こります。結果は ArrayList に収集されます。

次のコマンドを使用してコードを実行しています。

私のコードは以下のとおりです::

次のエラーが発生します：

私を助けてください、事前に感謝します:)

java hadoop dictionary classnotfoundexception shingles

2016-07-20T10:26:29.347

0 投票する

1 に答える

863 参照

elasticsearch - Elasticsearch シングルトークンフィルターが機能しない

ローカルの1.7.5 Elasticsearchインストールでこれを試しています

私はこれを見る

そして、私はこのようなものを見ることを期待していました

何か不足していますか？

アップデート

そして、私はこのようにテストしようとしています

elasticsearch shingles

2016-07-20T14:27:53.613

0 投票する

1 に答える

790 参照

java - 異なる長さの部分文字列を生成するための hadoop mapreduce

Hadoop mapreduce を使用して、さまざまな長さの部分文字列を取得するコードを書いています。文字列「ZYXCBA」と長さ 3 を指定した例 (テキストファイルを使用して、「3 ZYXCBA」として入力します)。私のコードは、長さ 3 ("ZYX","YXC","XCB","CBA")、長さ 4("ZYXC","YXCB","XCBA")、最後に長さ 5("ZYXCB") のすべての可能な文字列を返す必要があります。 "、"YXCBA")。

マップフェーズでは、次のことを行いました。

キー = 必要な部分文字列の長さ

値 = "ZYXCBA"。

したがって、マッパーの出力は

reduce では、文字列 ("ZYXCBA") とキー 3 を使用して、長さ 3 のすべての部分文字列を取得します。4,5 についても同じことが起こります。結果は文字列を使用して連結されます。したがって、reduce の出力は次のようになります。

次のコマンドを使用してコードを実行しています。

私のコードは次のとおりです。

return の代わりに reduce の出力

戻ってきた

つまり、mapper と同じ出力が得られます。なぜこれが起こっているのか分かりません。これを解決するのを手伝ってください。助けてくれてありがとう;) :) :)

java hadoop mapreduce shingles

2016-07-21T10:47:38.187

問題タブ [shingles]

Reference