問題タブ [boosting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - ElasticSearch - あいまいな単語のスコアを上げる
ユーザーの検索語(apple iphone 5s)であいまい検索を実行したい。1 番目 (リンゴ) のスコア値を高くし、2 番目のスコア値を少し低くしたいと考えています。
以下のクエリから始めましたが、期待どおりに機能しませんでした。
このクエリの書き方がわかりますか??
search - Elastic.co/Elastic search - 複数のブースティング クエリによる関連性フィードバック
Elastic Search (Elastic.co) の関連性フィードバックを実装しようとしています。
私は、boolean must_not の場合のように否定的な用語を除外せずに、否定的な用語を割引するという考えで、肯定的な用語と否定的な用語の指定を可能にするクエリのブースティングを認識しています。
ただし、肯定的な用語と否定的な用語の両方で、階層化されたブーストを達成しようとしています。
つまり、ビニングされたポジティブ ワードとネガティブ ワードのリストを取得し、それぞれが独自のクエリ ワードを含む、異なるポジティブ ブースト層とネガティブ ブースト層が存在するようなクエリを生成したいと考えています。
(疑似クエリ)のようなもの:
私の質問は、ネストされたブースティングクエリでこれを達成できるかどうか、または複数のshould句を使用したほうがよいかどうかです。
私の懸念は、bool クエリの should 句で 0.2 のブーストを行っても、ドキュメントのスコアがプラスに増加するかどうかわからないことです。これは、スコアを増加させるのではなく、ドキュメントを割引したいためです。 .
クエリのブースティングでは、肯定的な用語の重み付けの程度を制御できないことが懸念されます。
他の実装に関するヘルプや提案をいただければ幸いです。(私が本当にやりたかったのは、関連するドキュメントの言語モデルを作成し、それを使用してランク付けすることでしたが、エラスティックで簡単に実現する方法がわかりません。)
python - sklearn を使用した勾配ブースティング分類子損失関数 - オペランドを一緒にブロードキャストできませんでした
sklearn Gradient Boosting Classifier の estimator.loss_ メソッドに問題があります。時間の経過に伴うトレーニング エラーと比較して、テスト エラーをグラフ化しようとしています。これが私のデータ準備の一部です:
この時点で、配列の形状を
私は得る:
それぞれ。
したがって、sklearnのドキュメントによると、私の形状は互換性があります。しかし次に、テスト スコア ベクトルを入力して、トレーニング エラーと比較するためにグラフ化します。
次のエラーが表示されます。
その47がどこから来ているのかわかりません。以前に別のデータセットで同じ手順を使用しましたが、問題はありませんでした。どんな助けでも大歓迎です。
python - xgboostで個々の決定木の重み付けにアクセスするには?
ランキングにxgboostを使用しています
私が理解しているように、勾配ブースティングは、学習した決定木の重み付き合計を計算することによって機能します。学習した各ブースターに割り当てられた重みにアクセスするにはどうすればよいですか? トレーニング後に重みを後処理して予測ステップを高速化したかったのですが、個々の重みを取得する方法がわかりません。を使用するdump_model()
と、作成されたファイルにさまざまなディシジョン ツリーが表示されますが、重み付けは保存されません。API で、適切な関数が見つかりませんでした。または、収縮パラメータを使用して手動で重みを計算できますeta
か?
r - Rでの回帰にXGBoostアルゴリズムを使用するには?
予測のために XGBoost 手法を試していました。私の従属変数は連続なので、XGBoost を使用して回帰を行っていましたが、さまざまなポータルで利用可能な参照のほとんどは分類用です。使って分かっているのに
回帰を行うことはできますが、他のパラメーターについても明確にする必要があります。誰かが私にそれのRスニペットを提供してくれれば、それは大きな助けになるでしょう.
tree - XGBoost - 学習率
XGBoost を使用して実験を行っています。反復回数を 1000 に設定すると、妥当な結果が得られます。
私が何か違うことをしようとしたよりも:
1000回の反復を実行する代わりに、100回の反復を実行したいと思います。これを10回繰り返します(合計でも1000回の反復)。この 10 ステップの間に、target_learn = target_learn - target_fitted (前のステップから) をセットアップしました。
そして、target_fitted = target_fitted + 予測よりも
Target_fitted 予測は、すべてのデータセットに対するテスト セットのクロス検証によって得られます。
異なる結果が得られました - 非常に精度が悪いです。
200回実行された5回の反復のみを実行するよりもはるかに...さらに悪い..
私がこれをやろうとしている理由は、反復中に学習マトリックスを変更したいからです (少し繰り返し何かをしようとしています)。
結果が異なる理由は何ですか...各ステップの最初の反復は何か違うように思われるので、モデルでこの反復を何度も行っているため、精度が低下しています...
他のパラメータは同じです..
または多分私は何かを完全に見逃しています..?どうも
elasticsearch - multi_matchクエリを使用したElasticsearch 2.xの異なるタイプの同じフィールドに対する異なるブースティング
ドキュメントに記載されているように、次のことを実行しようとしています(これは現在では古くなっている可能性があります)。
https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping.html
そこで説明されているシナリオを、私が達成したいことに適応させます。
トピック 1 に関するブログ投稿用の blog_t1 と、トピック 2 に関するブログ投稿用の blog_t2 の 2 つのタイプがインデックスにあるとします。どちらのタイプにもタイトル フィールドがあります。
次に、blog_t1 のタイトル フィールドのみにクエリ ブースティングを適用します。
以前のバージョンの Elasticsearch では、blog_t1.title と blog_t2.title を使用して、タイプからフィールドを参照できました。そのため、そのうちの 1 つをブーストするのは、blog_t1.title^2 と同じくらい簡単でした。
しかし、Elasticsearch 2.x 以降、タイプの古いサポートの一部が削除されました (あいまいさを取り除くなどの正当な理由により)。これらの変更については、ここで説明します。
https://www.elastic.co/guide/en/elasticsearch/reference/current/breaking_20_mapping_changes.html
だから私の質問は、multi_match クエリで、Elasticsearch 2.x を使用して、blog_t2 ではなくタイプ blog_t1 に対してのみ、タイトルに対してそのブーストを行うにはどうすればよいですか?
クエリは次のようになりますが、type.fieldはもはや問題ではないため、これは明らかに機能しません。
参考までに、私がこれまでに見つけた唯一の解決策は、タイトルに別の名前を付けることです。たとえば、blog_t1 には title_boosted を、他のものには単にタイトルを付けます。これは、「タイトル」をユニークなこと。
ありがとう。
c# - Accord.NET: Boost 分類器のトレーニング方法
オブジェクトの分類に Accord.NET ライブラリを使用しようとしていますが、適切な例が見つからず、プロセスを理解するにはドキュメントが不十分です。私の現在のコードは
「コンパイル可能」になるように書かれていますが、 DecisionStumpの入力パラメーターと2 番目のAdaBoostパラメーター全体の本質が何であるかはわかりません。Boost分類子を適切に作成してトレーニングする方法を誰かが説明できますか?
classification - ツリーモデルの類似性を定量化する方法は? (XGB、ランダム フォレスト、勾配ブースティングなど)
XGB などのツリー ベースのモデルの類似性を定量化するアルゴリズムはありますか? たとえば、クロス検証などで異なるデータセットを使用して 2 つの XGB モデルをトレーニングし、予測の堅牢性や一貫性、および機能の使用方法を推定したいと考えています。