問題タブ [boosting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - sklearn の GradientBoostingClassifier のコードを生成する
トレーニング済みの勾配ブースト分類器 (sklearn から) からコード (今のところ Python ですが、最終的には C) を生成したいと考えています。私が理解している限り、モデルは最初の予測子を取り、次に、順次トレーニングされた回帰ツリー (学習係数によってスケーリング) からの予測を追加します。選択されたクラスは、最高の出力値を持つクラスです。
これは私がこれまでに持っているコードです:
この質問からツリー生成コードを変更しました。
これが生成するものの例です (3 つのクラス、2 つの推定器、1 つの最大深度、0.1 の学習率)。
これに基づいて、対数確率を F0 として使用しました。
predict
1 つの推定量については、トレーニング済みモデルのメソッドと同じ予測が得られます。ただし、さらに推定量を追加すると、予測が逸脱し始めます。ステップの長さを組み込むことになっていますか (ここで説明されています)? また、私のF0は正しいですか?私は平均を取るべきですか?そして、対数確率を別のものに変換する必要がありますか? どんな助けでも大歓迎です!
tree - ツリー出力を使用して、Spark で勾配ブースティング ツリーの場合のクラスの確率を予測する
現在、Spark の GBT は予測されたラベルを提供することが知られています。
クラスの予測確率を計算しようと考えていました(すべてのインスタンスが特定の葉の下にあるとします)
GBT を構築するためのコード
これにより、簡単にするために、以下のように深さ 2 の 2 つのツリーが得られます。
私の質問は: 上記のツリーを使用して、次のような予測確率を計算できますか?
予測に使用される機能セットのすべてのインスタンスに関して
exp(ツリー 0 のリーフ スコア + ツリー 1 のリーフ スコア)/(1+exp(ツリー 0 のリーフ スコア + ツリー 1 のリーフ スコア))
これは一種の確率を与えてくれます。しかし、それが正しい方法かどうかはわかりません。また、リーフスコア(予測)の計算方法を説明するドキュメントがある場合。共感していただける方がいらっしゃれば本当に嬉しいです。
どんな提案でも素晴らしいでしょう。
python - AdaBoost を使用して Keras ベースのニューラル ネットワークをブーストする方法は?
バイナリ分類問題に次のニューラル ネットワークを適合させると仮定します。
AdaBoost を使用してニューラル ネットワークをブーストするにはどうすればよいですか? ケラスにはこれのためのコマンドがありますか?
machine-learning - 特徴エンジニアリングのための勾配ブースティングツリー? (ランク)
私は、Web ページでクリック/却下があるプロジェクトに取り組んでおり、それに応じて Web ページをランク付けしたいと考えています。私は当初、関連性スコアを計算するための簡単な式を書いてこれを行いましたが、ランダム ブースティング ツリーがこれに役立つと聞いています。ただし、ランダムブースティングツリーを使用して、ページの「ランク」機能をどのように設計できますか? 私は ML と、トレーニングで出力が得られる教師あり学習の経験がほとんどありません。
lucene - Cloudant 検索インデックスのパフォーマンスで lucene のブーストを使用する
Cloudant 検索インデックスでブースティングがどのように機能するかを見つけようとしています。つまり、単語「some text」で検索したい場合、「some」のブーストを 4 に、「text」を 1 に増やします。Cloudant は最初に「some」を含むドキュメントを検索し、次に「text」を検索します。最初の検索から返されたドキュメントで。それとも、「一部」と「テキスト」の両方を同時に検索し、関連性に基づいた一致を計算しますか?
algorithm - ブースティングで決定木を実装する方法
CART と C4.5 を使用する AdaBoost(Boosting) を実装しています。AdaBoost について読みましたが、AdaBoost とデシジョン ツリーを結合する方法がわかりません。n個の例を持つデータセットDがあるとします。D を TR トレーニング例と TE テスト例に分割しました。TR.count = mとすると、1/mになるように重みを設定し、TRを使用してツリーを構築し、TRでテストして間違った例を取得し、TEでテストしてエラーを計算します。次に、ウェイトを変更します。次に、次のトレーニング セットを取得するにはどうすればよいですか? どのような種類のサンプリングを使用する必要がありますか (置換の有無にかかわらず)? 新しいトレーニング セットは、間違って分類されたサンプルにもっと焦点を当てる必要があることはわかっていますが、どうすればこれを達成できますか? CART や C4.5 は、重みの大きい例に焦点を当てる必要があることをどのように判断するのでしょうか?
elasticsearch - ブーストは、Elasticsearch のブール値でフィルター処理されたクエリでは効果がありません
用語フィルターに一致するドキュメントにブーストを追加しようとしています。基本はBoolean/MatchAllクエリです。しかし、Elasticsearch クエリのブーストは効果がありません。すべての結果スコアは 1 に設定されます。
ただし、フィルタリングされたクエリを使用すると、ブーストが機能します。しかし、システムの制限により、フィルターされたクエリを使用できません。元のクエリでブースティングを機能させる方法はありますか?