問題タブ [boosting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tree - XGBoost - 学習率
XGBoost を使用して実験を行っています。反復回数を 1000 に設定すると、妥当な結果が得られます。
私が何か違うことをしようとしたよりも:
1000回の反復を実行する代わりに、100回の反復を実行したいと思います。これを10回繰り返します(合計でも1000回の反復)。この 10 ステップの間に、target_learn = target_learn - target_fitted (前のステップから) をセットアップしました。
そして、target_fitted = target_fitted + 予測よりも
Target_fitted 予測は、すべてのデータセットに対するテスト セットのクロス検証によって得られます。
異なる結果が得られました - 非常に精度が悪いです。
200回実行された5回の反復のみを実行するよりもはるかに...さらに悪い..
私がこれをやろうとしている理由は、反復中に学習マトリックスを変更したいからです (少し繰り返し何かをしようとしています)。
結果が異なる理由は何ですか...各ステップの最初の反復は何か違うように思われるので、モデルでこの反復を何度も行っているため、精度が低下しています...
他のパラメータは同じです..
または多分私は何かを完全に見逃しています..?どうも
elasticsearch - multi_matchクエリを使用したElasticsearch 2.xの異なるタイプの同じフィールドに対する異なるブースティング
ドキュメントに記載されているように、次のことを実行しようとしています(これは現在では古くなっている可能性があります)。
https://www.elastic.co/guide/en/elasticsearch/guide/current/mapping.html
そこで説明されているシナリオを、私が達成したいことに適応させます。
トピック 1 に関するブログ投稿用の blog_t1 と、トピック 2 に関するブログ投稿用の blog_t2 の 2 つのタイプがインデックスにあるとします。どちらのタイプにもタイトル フィールドがあります。
次に、blog_t1 のタイトル フィールドのみにクエリ ブースティングを適用します。
以前のバージョンの Elasticsearch では、blog_t1.title と blog_t2.title を使用して、タイプからフィールドを参照できました。そのため、そのうちの 1 つをブーストするのは、blog_t1.title^2 と同じくらい簡単でした。
しかし、Elasticsearch 2.x 以降、タイプの古いサポートの一部が削除されました (あいまいさを取り除くなどの正当な理由により)。これらの変更については、ここで説明します。
https://www.elastic.co/guide/en/elasticsearch/reference/current/breaking_20_mapping_changes.html
だから私の質問は、multi_match クエリで、Elasticsearch 2.x を使用して、blog_t2 ではなくタイプ blog_t1 に対してのみ、タイトルに対してそのブーストを行うにはどうすればよいですか?
クエリは次のようになりますが、type.fieldはもはや問題ではないため、これは明らかに機能しません。
参考までに、私がこれまでに見つけた唯一の解決策は、タイトルに別の名前を付けることです。たとえば、blog_t1 には title_boosted を、他のものには単にタイトルを付けます。これは、「タイトル」をユニークなこと。
ありがとう。
c# - Accord.NET: Boost 分類器のトレーニング方法
オブジェクトの分類に Accord.NET ライブラリを使用しようとしていますが、適切な例が見つからず、プロセスを理解するにはドキュメントが不十分です。私の現在のコードは
「コンパイル可能」になるように書かれていますが、 DecisionStumpの入力パラメーターと2 番目のAdaBoostパラメーター全体の本質が何であるかはわかりません。Boost分類子を適切に作成してトレーニングする方法を誰かが説明できますか?
classification - ツリーモデルの類似性を定量化する方法は? (XGB、ランダム フォレスト、勾配ブースティングなど)
XGB などのツリー ベースのモデルの類似性を定量化するアルゴリズムはありますか? たとえば、クロス検証などで異なるデータセットを使用して 2 つの XGB モデルをトレーニングし、予測の堅牢性や一貫性、および機能の使用方法を推定したいと考えています。