問題タブ [solr5]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - SolrCloud vs スタンドアロン Solr
標準の 4.x Solr インストールを Solr クラウド 5.x にアップグレードしようとしています。2 つの間でいくつかのパフォーマンス テストを行ったところ、大きな違いが見つかりました。同じサーバーで、さまざまな時点で、以下を実行しました。
- Solr クラウド 5.2.1 & 5.3、2 つのシャード、2 つのレプリカ、3 つの飼育係
- Solr 標準 両方とも同じ構成 (solrconfig など) を持っています。
どちらも同じデータです
サンプルクエリを複数回実行したときの平均結果は、標準の Solr が Solr クラウドよりも 5 倍高速でした。
また、dataimport ハンドラーも、標準の solr よりも 2 倍高速でした。
この不一致の理由と、solrcloud のパフォーマンスを改善する方法について何か考えはありますか?
solr - Solrドキュメントを理解する=
2 つのインデックス付きドキュメントがあり、一方が他方よりも高い理由の関連性を理解しようとしています。だから私はDebugQuery=True
説明を得るために走った。以下は、2 つのドキュメントの関連する相違点です。
2 種類のドキュメント
関連する可能性があります。ドキュメントは、*_s フィールドを使用して区別する 2 つの異なるタイプです。したがって、私のフィールドmodule_sには2つのモジュール1と2があります。私のクエリは次のとおりです。
したがって、これが問題を引き起こすとは思いませんが、この情報を追加したかったのです。
関連する説明の違い:
ドキュメント 1 - モジュール タイプ = 1
ドキュメント 2 - モジュール タイプ = 2
あらすじと質問
ご覧のとおり、説明はほとんど同じです。それらはすべて同じ queryWeight、boost、idf、および queryNorm を持っています。違いは、doc=XXX です。ドキュメント 1 の場合は で351328
、ドキュメント 2 の場合は174
です。誰かがこの数字が何であるか説明できますか? それはどこから来たのですか?そして、なぜそれは異なるのですか?
使用されるリソース
solr - Solr インデックスを CoreAdmin API とマージする
複数の solr コアの solr インデックスを新しいコアにマージしようとしています。これにはcoreAdmin APIを使用しています。しかし、私が得るのは、エラーや成功メッセージのない空の応答ヘッダーだけです。
これはsolrドキュメントのAPIです。
この後、私はこの応答を受け取ります
ガイドしてください。複数のコアからインデックスを正常にマージする方法。Solr 5.3 を使用しています
Solr Documentation MERGEINDEXESからの Mergin Indexes のリンクは次のとおりです。
xml - Solr DataImportHandler は、定義されたすべてのデータのインデックスを作成していません
私はsolr5.3を使用しています。
「DataImportHandler」を使用してウィキペディアのページの記事のダンプを solr にアップロードしようとしていますが、クエリを実行すると ID ファイルとタイトル ファイルしか取得できません。
以下は私のdata-config.xmlです
また、以下の全体を schema.xml に追加しました。
「example/example-DIH/solr/solr/conf/schema.xml」から schema.xml をコピーし、コメントに記載されているいくつかの例外を除いて、すべてのフィールド エントリを削除しました。
データをインポートした後、すべてのフィールドを取得しようとしていますが、「ID」と「タイトル」しか取得していません。
また、インデックス作成に関する情報を取得できるように、デバッグ モードを使用して documentImport を実行しようとしましたが、デバッグ モードを選択すると、2 つのドキュメントしかインポートされません。なぜかわからないのですが?このため、インデックス作成プロセスをデバッグできません。
さらに案内してください。
編集 - df=user または text を指定すると、メッセージの下に表示されるため、他のフィールドがインデックス化されていないことがわかりました。
"msg": "未定義フィールド ユーザー",
以下のようにクエリを実行しています: http://localhost:8983/solr/wiki/select?q= %3A &fl=id%2Ctitle%2Ctext%2Crevision&wt=json&indent=true&debugQuery=true
solr - Solr Cloud - 一意のフィールドでクエリを実行すると、異なる結果が返される
Solr 検索へのクエリが異なる値を返すという問題に遭遇しました。ただし、一意のキー フィールドに設定されている ID を照会しています。
したがって、Solr Admin UI で次のようなクエリを実行します。
関連する応答情報を以下に示します。
そのクエリを数回実行すると、最終的には異なる応答が得られます。
URLが異なりますのでご注意ください。
Debug Query がチェックされています。GET_FIELDS
さまざまな URL がセクションにあることがわかります。
なぜ/どのように異なる情報を取得できますか? 一意のフィールドとしてマークされている ID を照会しています。私の理解では、それら以上のものは決してないはずです。これは同期の問題でしょうか? 単一のコアが選択された Solr 管理 UI クエリを使用しています。
その ID を持つドキュメントが 1 つだけインデックスにあるかどうかを確認する方法はありますか?
アップデート:
ファセット クエリを実行したところ、unique が 2 を返しました
対問題を抱えていないもの。
これは正しいですか?ドキュメントが重複しているという点で、これは私の問題を説明していますが、その場合、異なるデータではなく 2 つのドキュメントが返されないのはなぜですか?
solr - Solr 5.3.0 で提案を取得する方法
Solr 5.3.0 を使用してオートコンプリート機能を実装しようとしています
solrconfig.xml は次のようになります
管理スキーマは次のようになります。
Solr の管理パネルからアナライザーを使用すると、インデックス付きの ngram が表示されます。そして、一致を指摘することに成功します。
ただし、クエリを使用すると:
0 件の提案がありました。レスポンスはこちら: https://api.myjson.com/bins/47r3i
いずれかのドキュメントの名前キーに「Jindal Panther」という値が存在します。
さらに、タイプが「String」、ソースが「name」のダミーのコピーフィールド「suggest」を作成すると、「name」で正常に機能する提案が「suggest」では機能しないことがわかりました。これは、提案を有効にするための copyfield の構成ミスでしょうか?
どんな助けでも大歓迎です。前もって感謝します。
編集:解決策を得ました。以下の受け入れられた回答とそのコメントを参照してください。サジェスターズについて見事に説明しているブログに出会いました。Solr Search の初心者にとっては、一読の価値があります。
solr - Haystack は、SOLR 5.3 でマルチコア クロスコア検索をサポートしていますか?
Haystack は、SOLR 5.3 でマルチコア クロスコア検索をサポートしていますか? SOLR には、core0、core1、core2 の 3 つのコアがあります。Haystack でクロスコア検索を実装するにはどうすればよいですか? Haystack 接続 URL を設定するにはどうすればよいですか? ありがとう!
solr - カテゴリ情報を Solr に保存する
solr データベースに製品情報を保存しています。製品は、複数のカテゴリの一部になることができます。
ここで、それらのカテゴリに属する製品内にそれらのカテゴリに関する情報を保存したいと考えています。(他に方法はありますか?)
たとえば、製品 A が ID I1 と I2 を持つカテゴリ C1 と C2 に属しているとします。この I1 から C1 へのマッピングを製品 A に保存するにはどうすればよいですか? そうするためのスキーマは何ですか?
ただし、ID、名前、およびその他のデータ (URL など) のリストを単純に保存すると、各 ID から名前または URL へのマッピングが失われます。このような:
では、書類はどのように保管すればよいのでしょうか。