問題タブ [gbm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - クラスの不均衡なデータセット(gbm)のgbmパッケージとカッパ統計で重みを定義する方法
キャレット パッケージで gbm の重みを定義する方法を見つけたいと思います。「caret」パッケージの「train」関数にはパラメーター「weights」がありますが、説明には「この引数は、ケースの重みを許可するモデルにのみ影響します」と記載されています。私の理解によると、「gbm」は重みの定義をサポートしていますが、重みを定義する形式はわかりません。単純に c(1,10) です - 1 は多数派クラス、10 は少数派クラスですか?
2 番目の質問は、カッパ統計量に関するものです。Kappa は、クラスの不均衡なデータ セットのより優れたパフォーマンス メトリックであると読みましたが、その方法を理解できませんでした。クラスの不均衡なデータ セットの ROC と比較して、Kappa がより優れたパフォーマンス メトリックである理由について、いくつかのガイダンスをいただければ幸いです。
ありがとう。
r - gbm の LamdbaMART 実装で設定された検証で 0 の逸脱を取得する
オブジェクトのリストのペアごとの並べ替えを実行するように LambdaMART モデルをトレーニングしようとしています。私のトレーニング データセットは、50,000 個の 112 次元の特徴ベクトルで構成されています。各機能は、負でない整数によってコード化されます。
ターゲット値は正の整数です (連続していません)。X と Y という 2 つの新しいインスタンスが与えられた場合、X の目標値が Y より大きいかどうかをモデルで予測できるようにしたいと考えています。
これは情報検索アプリケーションではないため、クエリの概念は関係ありません。50,000 のインスタンスすべてが同じ「クエリ」に属しています。
モデルを実行すると、70%/30% のトレーニングと検証の分割を使用するように設定しても、検証セットで逸脱が 0 になり、OOB を実行しようとすると gbm.perf 関数が例外をスローするようですツリーの最適な数を見つける方法。
全体として、このパッケージがこれらの役に立たない名前のパラメーターすべてを使用して何をしているのかについて、私はかなり混乱しています。私が知りたいのは、テスト検証セットを指定してから、ツリー サイズの範囲で検証エラーを最小限に抑えることだけです。多すぎるべきではありませんが、このパッケージでは、どのノブを設定する必要があるかを知るのが非常に難しくなっています...あまりにも多く、透明性を確保して何をしているのかを知るために、自分で実装しようとしています.
暴言を吐いて申し訳ありませんが、このパッケージが意味のある検証結果を返すようにするために、いくつかの助けを借りることができます.
r - ブーストされた多項モデルの精度を取得する
ブーストされたモデルの精度を見つけようとしています。私のコードは次のとおりです。
これを試すと、次のエラーが表示されます。
何を修正すればよいのか、何を間違っているのかわかりません。助言がありますか?
r - ループで gbm を実行し、r の各モデルの予測値を計算します
R のループで異なる学習率の gbm モデルを作成しようとしています。モデルごとにいくつかの統計を計算し、それらを元のデータ セットと組み合わせたいと考えています。
しかし、統計が計算されるたびに、前の統計と同じ名前で保存され、エラーが発生するため、エラーが発生します。
ループの最後に次のエラーが表示されます。
列車データは、基本的に日付、始値、終値などの株価データです。
コードは次のとおりです。
r - RでdoRedis/foreach GBM並列処理エラー
caret パッケージを使用して gbm モデルを実行しており、doredis パッケージで並列処理を使用して動作させようとしています。バックエンド ワーカーをすべて稼働させることはできますが、最終モデルに再結合するときに問題が発生します。このエラーが発生しています:
foreach ループを実行しようとするのはこれが初めてであり (gbm のような複雑な問題は言うまでもなく)、これを理解して実装しようとして問題が発生しています。私は多くの Google 検索を行ってきましたが、gbm で foreach を実装することについて何も見つかりませんでした。foreach を理解するための助けをいただければ幸いです。これが私のコードです:
更新
ある種のデータセットでの再現に関する提案に従って、mydata を Iris データセットに切り替えdata <- iris
、X と Y を に変更するx <- data[, -5]
y <- data[, 5]
と、同じエラーが発生しました。