問題タブ [scoring]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lucene - Luceneでは、スコアの計算に用語をどのように使用しますか?CustomScoreQueryでオーバーライドできますか?
誰かがクエリ内のドキュメントのスコアリングを正常にオーバーライドして、フィールドの内容に対する用語の「関連性」を自分の関数で判断できるようにしましたか?もしそうなら、それはCustomScoreQueryを実装し、 customScore(int、float、float)をオーバーライドすることによるものでしたか?正確な用語の一致を他の接頭辞の用語の一致よりもはるかに高くランク付けできるカスタムソートまたはカスタムスコアラーを構築する方法を見つけることができないようです。任意の提案をいただければ幸いです。
algorithm - 以前のスコアや他のプレイヤーと比較して、ゲームの最終スコアを計算する
マルチプレイヤー ゲームを想定すると、すべてのプレイヤーの以前のスコアに基づいて最終的なスコアを与える最も公平な方法です。
たとえば、2 人のプレーヤーの試合で、プレーヤー A がプレーヤー B の 2 倍のスコアを持っているとします。「A」が最初に終了しても、彼には多くのポイントが与えられません。最後にフィニッシュすると、彼はかなりのポイントを失うことになります。
algorithm - 最大距離の数の順序セット
(2 ~ 4) 個の数値の異なるセット(最大 100個) があります。セット内のセットまたは番号の順序は重要ではありません。最大数はセット数に関連し、30 まで上がります。
{1 2 3 4} {1 2 3 5} {1 2 3} {1 2 4 5} {6 2 4} {6 7 8 9} {6 7 9} {7 8 9} {2 4 8 9}
目標は、これらのセットを特定の順序で並べ、2 つの連続するセットに共通の数が含まれないようにすることです。あれは
{1 2 3 4} {2 4 8 9}
悪いです(2のため)。と
{1 2 3 4} {6 7 8 9}
いいね。
もちろん、特に与えられた例では、これはセットのセット全体では不可能です。ただし、ルールに違反するセットの数はほぼ最小限に抑える必要があります。
比較的多数のセットでは、ブルートフォース+スコアリングアルゴリズムは実行できないと思います。この問題を解決するための決定論的アルゴリズムに関する他のアイデアやヒントはありますか?
シャッフル + スコア アルゴリズムは適切な解決策を見つけることができると思いますか?
java - 異なる検索スペースサイズを使用した異なるlucene検索結果
luceneを使用して検索するアプリケーションがあります。検索スペースは数千にのぼります。これらの数千を検索すると、約20の結果しか得られません(これは問題なく、期待されています)。
ただし、検索スペースをこれらの20エントリだけに減らすと(つまり、これらの20エントリのみにインデックスを付け、他のすべてを無視して、開発が容易になるように)、同じ20の結果が得られますが、順序(およびスコアリング)が異なります。 。
Field#setOmitNorms(true)を使用してノルム係数を無効にしようとしましたが、それでも異なる結果が得られますか?
スコアの違いの原因は何ですか?
ありがとう
solr - ヒットを含むフィールドに基づいて Solr の結果をブーストする
索引付けと検索のフレームワークを探して Web をブラウジングしていたところ、Solr に出会いました。絶対に必要な機能は、ヒットが含まれるフィールドに基づいて結果をブーストすることです。
小さな例:
次のようなレコードを考えてみましょう:
title
たとえば、alternative_title
とフィールドを 1 つの検索フィールドに結合したいのですがplot
、Solr/Lucene のドキュメントとチュートリアルを見ればそれほど難しくありません。
ただし、ヒットした映画はヒットした映画よりもスコアが高く、ターン中の映画はフィールドのヒットよりもスコアが高くなることも望んでtitle
いalternative_title
ますplot
。
XML でこの種のスコアリングを示す方法はありますか、それとも独自のスコアリング アルゴリズムを開発する必要がありますか?
また、私が示した例は架空のものであり、実際のデータにはおそらく 100 以上のフィールドが含まれることにも注意してください。
java - Lucene ドキュメントのブースティング
ルセン ブースティングに問題があります。指定された (firstname) フィールドと一致する特定のドキュメントをブーストしようとしています。コードの一部を投稿しました。
なぜこれが機能しないのですか?
よろしくお願いします
algorithm - ユーザーアクティビティをスコアリングするためのアルゴリズム
ユーザーができるアプリケーションがあります:
- 製品についてのレビューを書く
- 製品にコメントを追加する
- 賛成/反対投票レビュー
- 上/下投票コメント
すべての賛成/反対投票はdbテーブルに記録されます。
私が今やりたいのは、過去4週間で最もアクティブなユーザーのランキングを作成することです。もちろん、良いレビューは良いコメントよりも重要視されるべきです。しかし、たとえば、10の良いコメントは、1つの良いレビューよりも重み付けする必要があります。
例:
公正なスコアリング関数はどのようになりますか?score()
関数の実装はどのように見えるでしょうか?g
レビューがより重く重み付けされるように関数に重みを追加するにはどうすればよいですか?たとえば、写真への投票が追加された場合、そのような関数はどのようになりますか?
overflow - 不必要に制限的な制限 - ウィンブルドン テニス スコアボード
http://en.wikipedia.org/wiki/Isner%E2%80%93Mahut_match_at_the_2010_Wimbledon_Championships
したがって、史上最長のテニスの試合は、コート上のスコアボードを 47-47 で破り、ウェブサイトを 50-50 で破りました。
少なくともミレニアム バグでは、日付が 2 桁で格納されていました。
ここにはどのような言い訳がありましたか? また、このように不必要に制限されるまで、プログラムが完璧な嵐に備えていないことはどれほど一般的ですか?
comparison - lucene と solr のスコアリング
SOLR と LUCENE で使用されるスコアリング メカニズムをより簡単な言葉で比較するために、誰かが説明 (または参照を引用) できますか。それらに違いはありますか?
私はsolr/luceneが得意ではありませんが、私の発見はそれらが異なるかのように示しました.
PS: 「+Contents:risk」のような単純なクエリを試しただけで、他のフィルタは使用しませんでした。