問題タブ [random-forest]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R ランダム フォレスト変数の重要性
Rでの分類にランダムフォレストパッケージを使用しようとしています.
リストされている可変重要度メジャーは次のとおりです。
- クラス 0 の変数 x の生の重要度スコアの平均
- クラス 1 の変数 x の生の重要度スコアの平均
MeanDecreaseAccuracy
MeanDecreaseGini
今、私はそれらの定義を知っているように、これらの「意味」を知っています。私が知りたいのは、それらの使い方です。
私が本当に知りたいのは、これらの値がどれほど正確であるか、良い値とは何か、悪い値とは何か、最大値と最小値などのコンテキストでのみ、これらの値が何を意味するかです.
変数の値が高い場合、それは重要か重要でないかMeanDecreaseAccuracy
? MeanDecreaseGini
また、生のスコアに関する情報も役立ちます。それらの適用に関連するこれらの数値について知っておくべきことをすべて知りたい.
「エラー」、「合計」、または「順列」という言葉を使用する説明は、ランダム フォレストがどのように機能するかについての議論を含まない単純な説明よりも役に立ちません。
ラジオの使い方を誰かに説明してほしいと思ったとしても、ラジオが電波を音に変換する仕組みが説明されているとは思いません。
r - Rランダムフォレストを使用して、個別のクラスを持たない属性を減らす方法は?
属性削減のためにランダムフォレストを使用したい。私のデータにある問題の1つは、離散クラスがないことです。連続のみです。これは、例が「通常」とどのように異なるかを示しています。このクラス属性は、ゼロから無限大までの一種の距離です。そのようなデータにランダムフォレストを使用する方法はありますか?
machine-learning - デシジョンツリーの学習と不純物
不純物を測定する方法は3つあります。
各方法の違いと適切な使用例は何ですか?
matlab - ランダム フォレストのコード レビュー
ランダム フォレスト アルゴリズムに関する研究プロジェクトを行っています。私はアルゴリズムの実装を数多く見つけましたが、コードの主要部分は Fortran で書かれていることが多く、私は完全に初心者です。
コードを編集し、主要なパラメーター (ツリーの深さ、機能変数の数など) を変更し、実行ごとにアルゴリズムのパフォーマンスを追跡する必要があります。
現在、「Windows-Precompiled-RF_MexStandalone-v0.02-」を使用しています。トレーニング関数と予測関数は matlab mex ファイルであり、開いたり編集したりすることはできません。何をすべきか、またはランダムフォレストの有効で完全にmatlabベースのバージョンがあるかどうかについて、誰かが私にアドバイスを与えることができますか?
randomforest-matlab を注意深く読みました。残念ながら、主なトレーニング部分は dll ファイルです。もっと読むことで、私の不思議のほとんどが解決されました。私の質問は主に、複数のツリーを同時に実行する方法でした。
c++ - OpenCV-ランダムフォレストの例
cvMatではなく2.3.1APIMatでランダムフォレストを使用した例はありますか?
基本的に、16x16x3要素を持つ1000行で構成されるマトリックスマットデータがあり、マトリックスマットは各行が属するクラスを保持する1000x1マトリックスに応答します。これでランダムフォレストアルゴリズムを実行したいと思います。
r - Rは複数のrandomForestオブジェクトをベクトルに入れます
R にベクトル/リスト/配列などにオブジェクトを配置する機能があるかどうかに興味があります。randomforest パッケージを使用して、より大きなデータのサブセットを処理しており、各バージョンをリストに保存したいと考えています。これは次のようになります。
理想的には、次のようなことをしたいと思います。
この種の作品ですが、単一の RF オブジェクトの出力は次のとおりです。
これは「回答」リストの出力ですが、
保存された情報が単一の RF オブジェクトと同じになるように、すべての RF オブジェクトを保存する方法またはそれらを呼び出す方法を知っている人はいますか? 提案をありがとう。
r - ランダム フォレストを高速化するための提案
パッケージでいくつかの作業を行っていrandomForest
ますが、うまく機能しますが、時間がかかる場合があります。物事をスピードアップするための提案はありますか? デュアルコア AMD チップを搭載した Windows 7 ボックスを使用しています。R がマルチスレッド/プロセッサではないことは知っていますが、並列パッケージ ( rmpi
、snow
、snowfall
など) のいずれかが機能するかどうかに興味がありましたrandomForest
。ありがとう。
編集:
いくつかの分類作業 (0 と 1) に rF を使用しています。データには約 8 ~ 12 の変数列があり、トレーニング セットは 10,000 行のサンプルであるため、適切なサイズですが、クレイジーではありません。私は 500 本の木と 2、3、または 4 本の mtry を実行しています。
編集2:ここにいくつかの出力があります:
r - foreachおよびdoMCパッケージを使用してランダムシミュレーションのシードを設定するにはどうすればよいですか?
いくつかのシミュレーションを実行する必要があり、デバッグの目的でset.seed
同じ結果を得るために使用したいと思います。これが私がやろうとしていることの例です:
オブジェクトa
とb
は同一であるsum(abs(a-b))
必要があります。つまり、ゼロである必要がありますが、そうではありません。私は何か間違ったことをしていますか、それともいくつかの機能に遭遇しましたか?
これは、R2.13とR2.14の2つの異なるシステムで再現できます。
r - Rで値が欠落しているランダムフォレストを使用するには?
ランダム フォレスト モデルを当てはめたいのですが、次のエラーが発生します。
16 個の数値属性でデータ フレームを学習させ、WIN はレベル 0 1 の係数です。
r - Rrfcvはデータを分割できません
パッケージrfcv
内の関数を使用しようとしています。randomForest
次のようなエラーメッセージが表示されます。
何かがおかしいと思われますか?一意の値が5で割り切れるようにデータを縮小しようとしましたが、それでも同じメッセージが表示されます。cv.fold=
また、効果なしでいろいろな値を試してみました。