問題タブ [adaboost]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - トレーニング済みの AdaBoost 分類器から Haar 特徴を表示する
分類器のすべての段階でどの Haar 機能が使用されているかを視覚的に表示する方法はありますか?
私は最近、opencv_traincascade.exe を使用して、車両を検出する分類器をトレーニングしました。さらなる分析のために、すべての段階で機能が評価されていることを確認したいと思います。
ご協力いただきありがとうございます。
編集
ノードの意味とは何か、cascade.xmlに関する情報を誰かが提供できれば素晴らしいことです。ありがとう
adaboost - エラー率がゼロの場合のアルファの計算方法 (Adaboost)
アルファのアルゴリズムは
(0.5) * Math.log(((1 - errorRate) / errorRate))
ありがとうございました。
opencv - haar 分類器の cascade.xml の説明
誰かが cascade.xml の数値/値を完全に説明できれば最高です。例:
これらの値の意味は何ですか
もう 1 つの質問は、特定のステージで使用する機能をプログラムがどのように認識するかということです。私の知る限り、機能は次のような形になっています
これにより、以下のようなものを形成する 2 つの長方形の座標になります。
-1 の値は何ですか。と 3. とはどういう意味ですか? 私はそれが重みであることを知っていますが、機能を計算するためにどのように使用されますか?
概要
- 内部の値の意味は何
<internalNodes>
ですか? - 機能はどのように計算されますか? ウェイトはどのように
<rects>
使用されていますか? - 最も重要なことは、どのフィールドが特定のステージ/ノードでどの機能が使用されているかを示すことです。
ありがとう!
r - R gbmパッケージ:トレーニングエラーとAdaboost指数損失関数
私は二項分類のためにRでgbmパッケージを使用しています。アルゴリズムにadaboost指数損失関数を使用しています。2つの質問があります:
トレーニングエラーを確認したい場合は、これを確認する必要がありますか?(私のモデルオブジェクトがfitと呼ばれ、3倍のCVを使用したとします。)
best.iter <- gbm.perf(fit,method="cv")
fit$train.error[best.iter]
トレーニングデータセットで予測を行いたい場合は、次のコード行で、応答変数を削除して「train」と言います
pred <- predict(object=fit,newdata=train,n.trees=best.iter)
。それは私にadaboostの指数関数的な損失値を与えているだけです。これをバイナリクラスの確率に戻すにはどうすればよいですか?やってみplogis
ましlog
た。結果は意味がありません。たとえば、plogis
すべてに対して0.99 ***をlog
与え、間隔[0.52,0.56]を与えました。どのような変換を行う必要がありますか?
参考までに、私は100本の木を育てましたが、フィッティングプロセスは問題ないようです。例えば、
ありがとう!
c# - C#用の機械学習分類器AdaBoost
AdaBoostアルゴリズム用の人気のある安定したライブラリがC#にありますか?このようなライブラリには、従来のAdaBoost(GentleBoost、LogitBoostなど)以外に、さまざまな種類のブースティングが含まれていますか?
r - Adaboost の実装 (R での弱分類器関数形式の取得)
分類問題のために CRAN-R で Adaboost を使用しようとしています。実際に弱い分類器の機能形式を出力する R パッケージが見つかりません (例: hi(x) * I (Y > z))。これをスコアリング アルゴリズムとしてプログラムできます。これらを提供できるパッケージを教えてください。関数/係数?ありがとう!
r - randomForest、adaboost などの R ツリーベースのメソッド: 同じデータの結果を異なる形式で解釈する
私のデータセットが100 x 3
カテゴリ変数で満たされた行列であるとします。応答変数でバイナリ分類を行いたいと思います。次のコードでデータセットを作成しましょう。
データは次のようになります。
このデータに対して、2 つの異なるアプローチでランダム フォレストとアダブーストを実行しようとしました。最初のアプローチは、データをそのまま使用することです。
2 番目のアプローチは、データセットをワイド フォーマットに変換し、各カテゴリを変数として扱うことです。これを行っている理由は、実際のデータセットには var1 と var2 に 500 以上の要素があり、その結果、ツリー パーティショニングは常に 500 のカテゴリを 2 つの分割に分割するためです。そうすることで多くの情報が失われます。データを変換するには:
新しいデータは次のようになります。
この新しいデータセットにランダム フォレストとアダブーストを適用します。
2 つのアプローチの結果は異なります。と の各変数にレベルを追加すると、違いがより明確にvar1
なりvar2
ます。私の質問は、まったく同じデータを使用しているのに、結果が異なるのはなぜですか? 両方のアプローチの結果をどのように解釈すべきでしょうか? どちらがより信頼できますか?
c++ - openCV c++: CvBoost (Adaboost classifer) の操作に関する問題
都市設定の画像で人間を分類するためのアプリケーションを作成しています。
次の方法で分類子をトレーニングします。
train_rand.csv は、最初の列がカテゴリであるファイルです。残りの列は、問題の特徴になります。たとえば、3 つの機能を使用できます。それぞれが、画像のピクセルあたりの赤、青、緑の平均を表します。したがって、私のcsvファイルは次のようになります。最初の列では文字を使用しているため、OpenCV はそれをカテゴリとして認識していることに注意してください。
私の実際の問題では、100 個の機能と 8000 個のサンプルを使用しています。データの半分で分類子をトレーニングし、残りでテストします。
トレーニング後、約 5% のテスト エラーが発生しました (これは、100 個の機能だけではかなり良好です)。
ここで、新しいデータで分類器を使用したいと思います。
このコードを何千ものサンプルで実行していますが、常に同じ値である 2 が出力されます。ここで何が間違っているのか本当にわかりませんが、間違った方法で分類器をトレーニングしたとしても、そうなるでしょう。同じ方法で 100% の時間を分類します。また、前に計算したテスト エラーは、分類器が正常に機能することを示しています。
私を悩ませていることの 1 つは、SampleData が、トレーニングに使用したサンプルと同じ数の列を持たなければならないことです。問題は、トレーニングに使用されるデータには 100 列 + 1 つの応答があり、100 個の機能のみで分類子を実行しようとすると、サイズが一致しないという例外がスローされるということです。101 個の機能 (これは完全に任意です) で分類器を実行すると機能しますが、結果は意味をなさないものです。
誰でもこれで私を助けることができますか?前もって感謝します!
よろしく
r - ADA でカスタム分類子を使用するには?
ada
モデルに合わせてパッケージからadaboostを使用しています。アダブーストについての私の理解では、複数の分類子を組み合わせてより良い結果を得ています。しかし、関数ada
では、この目的のためのパラメーターが見つかりません。では、どの分類子がada
使用されているのでしょうか? 分類子を に渡すにはどうすればよいada
ですか? ありがとうございました。