問題タブ [shingles]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - solr シングル クエリ一致キーワード トークン化フィールド
私はSolr 5.5を使用していますが、ここで解決策を見つけたいという問題があります。
以下の設定を使用して作成したフィールドがあります。
このフィールドには、「ジャスティン ビーバー」のような値を指定できます。
そして、私の期待は次のとおりです。
「The artist Justin Bieber is a teen heartthrob」というクエリの場合、このドキュメントと一致させたいと思います。また、「ビーバー ジャスティンという名前のアーティストはカナダ人です」や「ジャスティンという名前はとても一般的です」などのクエリでは、一致が見つからないはずです。
デフォルトの「/select」リクエスト ハンドラを使用すると、「Justin Bieber」というクエリを発行すると、完全に一致するにもかかわらず、一致が見つからないことがわかります。しかし、別のフィールドが '/select' RH のデフォルト フィールドとして設定されていたため、以下の curl を使用して別の RH を作成しようとしました。
必要な RH が作成されましたが、クエリが必要なドキュメントと一致しませんでした。
この問題の解決策を教えてください。
以下は、クエリに対する応答の「デバッグ」セクションのスニペットです: "/exactName?q=exactName_noAlias_en_US:Justin%20Bieber&wt=json&indent=true&debug=true"
以下は、クエリに対する応答の「デバッグ」セクションのスニペットです。
以下は、/select RH を使用したフレーズ クエリに対する応答の「デバッグ」セクションのスニペットです。
以下は、/exactName RH を使用したフレーズ クエリに対する応答の「デバッグ」セクションのスニペットです。
以下は、クエリと、クエリ内の空白をエスケープした対応するデバッグ セクションです。
デバッグ:
elasticsearch - ElasticSearch: shingles - フィールドに正確な shingle トークンが含まれている場合に一致するフレーズ
私はエラスティック検索の初心者であり、次のシナリオで問題があります。
- 「テキスト」フィールドを 1 つだけ含む 2 つのドキュメントがあるとします。
- 「テキスト」:「token1 token4」
- 「テキスト」:「token2 token3」
- 「テキスト」:「token4 token5」
- そして、クエリテキスト "token1 token2 token3 token4 token5" に従って、ドキュメント 2 と 3 のみを検索したい
クエリから次のトークンを作成する shingles フィルターに似たものが必要です。
[「token1 token2」、「token2 token3」、「token3 token4」、「token4 token5」]
そして、これらのトークンによって完全に一致するため、トークン "token2 token3" と "token4 token5" はドキュメントと一致します。
前もって感謝します!
python - 配列を比較する最速の方法
この質問から拡張して、これに対する可能な限り最速の解決策が必要です:
以下を考えると:
これらのオブジェクト (または作成された新しいオブジェクト) を編集して、リスト m の各要素について、r のすべてのリストで 2 回未満しか存在しない場合、要素が m から削除され、どこからでも削除されるようにしたいと思います。 r.
したがって、上記の結果は次のようになります。
...「cde」は r で 1 回しか見つからないためです。
さらに良いのはこれです:
...または r のリスト全体での m の要素の頻度のカウント。次に、数値に基づいて、値が特定の基準を満たしている場合、出力のインデックスに基づいて r のリストを編集できます。
たとえば、i <2 または >100 の場合、r の各リストのインデックス i を削除します。
これを行うには回り道がありますが、1 月の糖蜜よりも遅くなります。
私の出発点はこれです:
これを生成します:
前もって感謝します!
solr - solr shingleFilterFactory が機能しない
最近、solr 4 から 6 に移行しました。
Solr 4shinglefilterfactory
では正しく動作しています私の設定は
しかし、solr 6 シングルに更新した後、動作しません。スキーマは次のとおりです。
[分析] タブでは適切なシングル結果が表示されていましたが、queryParser で使用すると適切な結果が得られませんでした
私のサンプルヒットは
解析されたクエリを次のように作成します。
r - equal.count 関数の後に属性変数に基づいてバーを積み重ねる
3 つの変数があります。私のテーブルのサイトレビューの従業員、PM、およびサイト。R にデータをインポートしました。
equal.count
関数 fromを使用して、データを 6 つの等間隔に分類しましたlibrary(lattice)
。
これをプロットして次の表を取得しました。
ただし、これらのバーをサイトごとに積み上げたいと思います。次の写真のようなもの。とにかく、これらのバーに属性変数 (サイト) を含めます。