2

ランダム フォレストは数値データを受け入れます。通常、テキスト データを持つフィーチャは数値カテゴリに変換され、連続した数値データは離散化されずにそのまま入力されます。RF はノードを作成するために連続データをどのように処理しますか? 連続数値データを内部でビン化しますか? または、各データを離散レベルとして扱います。

例:データセットを(もちろんテキスト機能を分類した後)RFにフィードしたい。連続データは RF によってどのように処理されますか? 給餌する前に、連続データ (この場合は経度と緯度) を離散化することをお勧めしますか? それともそうすると情報が失われますか?

経度および緯度フィーチャの連続データを示す画像

4

2 に答える 2

0

について質問していDecisionTreesます。はアンサンブル モデルであり、それ自体ではデータについて何も知らないためRandomForest、基本推定量 (この場合は ) からの決定に完全に依存し、DecisionTreesそれらを集計します。

では、連続した機能をどのようDecisionTreeに扱っているか:この公式ドキュメント ページを見てください。DecisionTreeClassifier木の写真を見ると、連続データセット(フィッシャーアヤメ)に適合しました-各ノードには、このノードで選択された機能に対するしきい値があります。

于 2015-09-19T21:19:04.023 に答える