2

異なる分類器でデータを予測しています。より良い最終結果を得るために、それらの結果をアンサンブルしたいと思います。Rで可能ですか?
まあ言ってみれば:

SVMpredict=[1 0 0 1...]
RFpredict=[1 1 0 1 ...]
NNpredict=[0 0 0 1 ...] 

Rで任意のアンサンブル手法で結果を組み合わせることができますか?どのように?
ありがとう

編集済み:
さまざまなサンプル (私の場合は DNA 染色体) で分類子を実行します。一部のサンプルでは、​​SVM は RF などの他のサンプルよりもうまく機能します。どちらの分類器がうまく機能するかを考慮して、結果をアンサンブルする手法が必要です。
たとえば、出力確率の平均を取り、それらを四捨五入すると、すべての分類器が結果として等しく有効であると見なされます。しかし、SVM がうまく機能した場合、SVM (86% の精度) の結果は 60% の重要性を持ち、RF では 25% (72% の精度)、15% の NN (64% の精度) を持つと考えるべきです。(これらの数値は明確化のための例にすぎません)
とにかくそれを行うことはできますか?

4

1 に答える 1

1

Your classifier の出力の構造によって異なります。あなたが提供したように、それが {0,1} の結果である場合、予測を平均し、それを平均して丸めることができます。

round((SVMpredict+RFpredict+NNpredict)/3)

分類子のパフォーマンスがわかっている場合は、加重平均を使用することをお勧めします。パフォーマンスの高いものを優先してください。筋金入りのアプローチは、optim関数を介して重みを最適化することです。

各予測のクラス確率がわかっている場合は、単に投票させるのではなく、それらを平均化することをお勧めします (上記の {0,1} 出力ケース)。

于 2015-05-05T11:42:20.060 に答える