問題タブ [morelikethis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr MoreLikeThis: Solr 5 ドキュメント ID を指定して、これらの 5 のようなドキュメントをさらに取得できますか?
ドキュメントからこの点については不明です。Solr X ドキュメント ID を指定して、それらに類似したドキュメントが必要であることを伝えることはできますか?
例:
- ユーザーは 5 つの異なる記事を閲覧しています
- これら 5 つの記事の ID を Solr に送信して、他の同様の記事をユーザーに提示できるようにします
ドキュメント ID の送信についても、この例のように MoreLikeThis が複数のドキュメントで動作できるかどうかについても明確ではありません。
solr - Solr MoreLikeThis とブースト関数の使用 (最近のアイテムのブースト)
「MoreLikeThis Solr リクエスト ハンドラで最近のアイテムをブーストする」と同様の質問があります。MoreLikeThis Solr リクエスト ハンドラで最近のアイテムをブーストする
MoreLikeThis ハンドラーまたはコンポーネントから返された最近のアイテムをブーストしたいと考えています。bf は Dismax パラメータであるため、MoreLikeThisHandler ではサポートされていないことがわかりました。
したがって、(solrconfig.xml内で)次のことを試しました:
と
apache - Solr で MoreLikeThis 関数を使用して、テキスト ファイルに類似したドキュメントを検索するにはどうすればよいですか?
私はsolrを使って次のことをしようとしています:
txt ファイルからテキストを読み取り、テキストに対して MoreLikeThis を使用して、そのテキストに類似したドキュメントを見つけます。Solrでこれを行うにはどうすればよいですか?
私がこれまでに知っていることから、コンテンツストリームを使用する必要があると思いますが、設定方法がわかりません...
solr - Solr MLT: 類似したキーワードを持つすべてのレコードを取得する
次のように、レコードのキーワードを含む、必要なすべての検索可能なテキストを含むフィールドがあります。
しかし、このフィールドで同様のレコード (MLT) を取得しようとすると、返される結果はゼロになります。何か不足していますか?Solr は何を探していますか?
アップデート:
テキスト型アナライザー:
solr - Solr クエリ フィルタリングのようなもの
SOLR の MLT (これに似た) 機能を使用しようとしていましたが、関連コンテンツのフィルタリングの使用方法に行き詰まりました。たとえば、solrの私のドキュメントには、スポーツ、エンターテイメント、面白い、ビジネスなどのさまざまなカテゴリがあります
各カテゴリに関連するもの (ユーザー クエリに基づく) が必要です。したがって、カテゴリ タイプでケース化された solr の MLT 結果をフィルタリングしたいと思います。どういうわけか結果をフィルタリングできますか?
不可能な場合は、どうにかして solr 関数クエリを使用して、関連するものがカテゴリ別にグループ化されていることを確認できますか?
ありがとう。
django - haystack more_like_this は異なるクラスのオブジェクトを返します
Article
呼び出すときにオブジェクトのリストを取得することを期待していますSearchQuerySet().more_like_this(an_article)
ただし、他のクラスのオブジェクトも返します。
ここで何が見逃される可能性がありますか?
lucene - Lucene で同様のドキュメントをスコアリングする方法は?
Lucene で同様のドキュメントをスコア付けしたいと考えています。私のシナリオを説明しましょう。
たとえば、インデックスを作成したファイルに次のレコードがあるとします。
「ジョン・ドウ」で検索すると
作成した検索インデックスは、次の順序でレコードを表示します
ご覧のとおり、Lucene は検索した用語に従ってレコードを表示していますが、レコード間の類似性に従ってではありません。提供された用語でレコードを検索したいが、それらの類似性に基づいて表示したい。
私が欲しいもの
ここでは、レコード John Twain と John Doe が一緒に表示されています。これは、どちらも類似しており、そのうちの 1 つがユーザー クエリで最大一致したためです。
あなたは私を手に入れていますか?
検索コード。
試みた方法:
私は MoreLikeThis クラスを使用しようとしていましたが、それが正しいのか、それとも正しい方法なのかさえわかりません。さらに、2 つ以上の docid に対して Like メソッドを使用するにはどうすればよいですか? また、docid を使用すると、同じリーダーから読み取っているため、重複したドキュメントが表示されます
コード:
ご不明な点がございましたら、お知らせください。
私は過去 2 週間から Lucene を学ぼうとしているので、よくわかりません。
注: Lucene.Net 3.0.3 を使用しています