問題タブ [ensemble-learning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1341 参照

sql-server - SSAS のアンサンブル分類器 (ランダム フォレスト、バギング、ブースティングなど)

SSAS (SQL Server 2008 R2) を使用して、値の 80% が欠落しているデータ セットの分類モデルを開発しています。ツリーに基づくアンサンブル分類器は、おそらく最良のソリューションです (ランダム フォレストなど)。

アンサンブル分類子を SSAS に追加する良い方法はありますか? たとえば、AdaBoostやその他のバギングやブースティングの分類器は?

SSAS がプラグイン機能を提供することは知っていますが、アンサンブル ソリューションを実行している人に出会ったことはありません。ダウンロードしてすぐに使用できるものは言うまでもありません。

そうでない場合、SSAS でさまざまな分類子を接続する効率的な方法はありますか? そこにある明らかな何かが欠けていることを願っています。

0 投票する
1 に答える
902 参照

weka - weka用のJRipアンサンブルパッケージ

Wekaでアンサンブル学習用のjRipパッケージをインストールする方法。アンサンブルを介して集合的なクラスタリング結果を集約する一環として、jRipパッケージをインストールする必要があります。Web上に同じものへのアクセスを提供する関連リンクが見つかりませんでした。助けてください。

0 投票する
1 に答える
1741 参照

c# - アンサンブル学習、多重分類器システム

MCS (Multi classifier system) を使用して、限られたデータに対してより良い作業を行うこと、つまりより正確になることを試みています。

現時点では K-means クラスタリングを使用していますが、FCM (Fuzzy c-means) を使用してデータをグループ (クラスター) にクラスター化することを選択する場合があります。データは色など、何でも表すことができます。まず、前処理と正規化の後にデータをクラスター化し、その間に多くの異なるクラスターをいくつか取得します。次に、クラスターをベイズ分類器のデータとして使用します。各クラスターは異なる色を表し、ベイズ分類器がトレーニングされ、クラスターからのデータが個別のベイズ分類器に渡されます。各ベイズ分類器は、1 つの色のみでトレーニングされます。色のスペクトル 3 ~ 10 を青、13 ~ 20 を赤、0 ~ 3 の間のスペクトルを 1.5 まで白とすると、1.5 ~ 3 まで徐々に青に変わり、青から赤まで同じになります。

私が知りたいのは、ベイズ分類器がより強力になるように、どのように、またはどのような集計方法 (それを使用する場合) を適用できるか、およびそれがどのように機能するかです。集計方法はすでに答えを知っているのでしょうか、それとも出力を修正するのは人間の相互作用であり、それらの答えはベイズトレーニングデータに戻されますか? それとも両方の組み合わせ?Bootstrap の集計を見ると、アンサンブル内の各モデルを同じ重みで投票する必要があるため、この特定のインスタンスでは集計方法としてバギングを使用するかどうかはよくわかりません。ただし、ブースティングには、新しいモデルの各インスタンスをトレーニングして、以前のモデルが誤って分類したトレーニング インスタンスを強調することによって、アンサンブルを段階的に構築することが含まれます。新しいインスタンスで段階的に構築する方法がわからないので、これがバギングのより良い代替手段になるかどうかはわかりませんか? そして最後のものは、仮説空間から仮説をサンプリングし、ベイズの法則を使用してそれらを組み合わせることによってベイズ最適分類子を近似しようとするアンサンブル手法であるベイジアンモデル平均化ですが、検索空間から仮説をどのようにサンプリングするかは完全にわかりませんか?

通常、2 つの分類アルゴリズム間でバウンスするために競争的アプローチを使用することを知っています。1 つは「はい」と言い、1 つはおそらく重み付けを適用できると言い、それが正しければ両方の分類子のベストを得ることができますが、維持のために私は競争的アプローチを望んでいません。

別の質問は、これら2つの方法を一緒に使用すると有益であるということです.私が提供した例は非常に原始的であり、その例には当てはまらないかもしれませんが、より複雑なデータでは有益です.

0 投票する
1 に答える
635 参照

machine-learning - RandomForestRegressor ですべてのアンサンブル推定値を取得する方法 (scikit-learn)

私はランダム フォレスト回帰を適合させようとしています。アンサンブル内のすべての回帰ツリーの出力を見て、何らかのリストで返された推定値の分布を取得したいと考えています。Rでは、predictメソッドpredict.allでオプションを提供すると、これが行われます.sklearnのクラスでrandomForestこれを行う方法はありますか?RandomForestRegressor

0.13 以降では、リーフ インデックスを返す apply メソッドが表示されますが、これらの使用方法がわかりませんRandomForestRegressor

助けてくれてありがとう。

0 投票する
4 に答える
9243 参照

python - scikit-learn で BaseEstimator を使用した GradientBoostingClassifier?

scikit-learn で GradientBoostingClassifier を使用しようとしましたが、デフォルトのパラメーターで正常に動作します。ただし、BaseEstimator を別の分類子に置き換えようとすると、機能せず、次のエラーが発生しました。

問題の解決策はありますか。

このエラーは、次のスニペットを使用して再生成できます。

エラーの完全なトレースバックは次のとおりです。

0 投票する
2 に答える
15917 参照

machine-learning - 弱学習者とは?

さまざまな分類器のさまざまなエラー率を弱学習器のエラー率と比較したい (ランダムな推測よりも優れている)。それで、私の質問は、単純で処理しやすい弱学習器のいくつかの選択肢は何ですか? それとも、概念を間違って理解しているのでしょうか? また、弱い学習者は単に私が選択したベンチマーク (線形回帰など) にすぎませんか?

0 投票する
0 に答える
559 参照

scikit-learn - 新しい学習アルゴリズムを使用して scikit-learn のアンサンブル メソッドを拡張する方法

実装する必要がある新しいデシジョン ツリー アンサンブル回帰メソッド アルゴリズムがあり、可能であれば Python ベースの scikit-learn パッケージが提供するインフラストラクチャ上に構築したいと考えています。新しいタイプの基本決定木と、それらを組み合わせてアンサンブル回帰予測を行う新しい方法を作成したいと考えています。

scikit-learn のドキュメントは、拡張ではなく使用法に焦点を当てています。既存のアンサンブル メソッドのコードを見てきましたが、かなり微妙な Python-fu が使用されているため、どこから始めればよいかわかりません。カスタムクラスで scikit を拡張する方法を説明するドキュメントを知っている人はいますか? または、この種の単純な拡張の例はありますか? (任意のモジュール上にある可能性があります。アンサンブルである必要はありません。)

ありがとう。

0 投票する
1 に答える
308 参照

intersystems-cache - Ensemble/CachObjectscript のファイル リスナー

アンサンブル初心者です。Cache/Ensemble に filesystemwatcher のようなものがあるかどうか知りたいです。(注: filesystemwatcher は .Net にあります)

私の要件は次のとおりです。私の Ensemble プロダクション (ビジネス プロセス) はフォルダーにファイルをドロップし、そのフォルダーで Windows サービスがファイルを処理し、このファイルを新しいファイルに置き換えます。

My Business プロセスは、新しいファイルがフォルダーで使用可能になるまで待機し、プロセスの再開を開始する必要があります。

これが Ensemble で可能かどうか教えてください。