4

ランダム フォレストを使用して多数の天体を分類していますが、比較的うまく機能しています。ただし、各機能の分散 (またはエラーバー) に関する情報を組み込むことで、パフォーマンスをさらに改善したいと考えています。

天文学では、通常、すべての測定値にエラー バーが関連付けられています。たとえば、赤色と青色を測定した場合、各色の測定値は明るさ (天文学では星の大きさ)、誤差、たとえば R 等級 14 +- 0.2、B 等級になります。 12 ± 0.15。

ランダム フォレストでエラー バーを追加の情報として使用する方法を考えたいと思います。何か案は?

4

2 に答える 2

0

エラーとカラー測定の両方が数値的特徴ですか? 次に、両方の機能の製品である新しい機能を追加するだけです。これは、Rでの相互作用と呼ばれるものだと思います

于 2013-04-04T08:32:16.150 に答える
0

検討できる簡単なことの 1 つは、各変数の誤差分布を使用してデータをリサンプリングすることです。したがって、x + u*sigma を取得して新しい例を生成します。ここで、u は通常の (0,1) 描画で、sigma はその変数のエラーの sd です。ノイズを適切に組み込むには、多くの追加サンプルが必要になる可能性がありますが (特徴の数によって異なります)、RF は並行してトレーニングするのが非常に高速であるため、簡単に進めることができます。また、サンプリングに相関ノイズを簡単に組み込むことができるという追加の利点もあります。

于 2013-11-19T07:54:05.367 に答える