問題タブ [ranking-functions]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

151 問題

0 投票する

3 に答える

1515 参照

sorting - 大規模なデータセットで複数の変数をランク付けする方法は?

約 30 の変数 (列) を持つ約 5,000 万レコードのデータセットがあります。変数ごとにデータセットをランク付けする必要があります。

この大規模なデータセットには大量のメモリが必要なため、プロシージャランクは機能しません。

ランクを手動で指定するには、それぞれの変数列でデータセットを並べ替えてから、数式を使用してランクを指定する必要があります。しかし問題は、データセットを 30 個の変数で 30 回ソートする必要があることです。これには非常に長い時間がかかり、実現不可能です。

この場合、どのような代替手段を使用できますか?

2016-10-27T06:53:22.043

0 投票する

1 に答える

559 参照

java - Lemur プロジェクトの RankLib ライブラリで、RankNet を検証およびテストするために使用できるメトリクスは何ですか?

私は現在、RankNet アルゴリズム (-ranker 4) の RankLib 実装をホールドアウトセットで使用しています。これを実行するためにターミナルでjarファイルを使用しています。

ドキュメントでは次のように規定されています。

metric2t (NDCG、ERR など) は、リスト単位のアルゴリズム (AdaRank、Coordinate Ascent、LambdaMART) にのみ適用されます。ポイント単位およびペア単位の手法 (MART、RankNet、RankBoost) は、その性質上、常に内部 RMSE / ペア単位の損失を最適化基準として使用します。

ただし、「metrics2t」を ERR@10 または NDCG@10 に設定すると、「RMSE」ではなく、選択したメトリックでトレーニングと検証が開始されます。

これは、RankNet を ERR@10 で実行したときに出力されたテーブルの一部です。

これは私には矛盾しているように見えるので、私が見逃しているものはありますか。

ありがとう。

java ranking metrics ranking-functions lemur

2017-03-29T09:44:01.090

1 2 3 4 5 6 7 8 9 10

問題タブ [ranking-functions]

sorting - 大規模なデータセットで複数の変数をランク付けする方法は?

java - Lemur プロジェクトの RankLib ライブラリで、RankNet を検証およびテストするために使用できるメトリクスは何ですか?

Reference