問題タブ [gini]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の多元分割のジニ指数を計算する
Rでジニ指数を計算しようとしています。次のように二分決定木のジニ指数を計算しても問題ありません。
ここで、3 つのノード (マルチウェイ分割) を持つ決定ツリーのジニ インデックスを計算したいと考えています。
次の表を取得しました。
車のクラス
0 0
0 1
1 0
1 0
2 1
R で列の車 (ノードが 3 つ) のジニ指数を計算することは可能ですか?
同じ関数で 3 つ以上のノードのジニ指数を計算することもできますか?
r - Rの多様性のブラウ指数
データ フレームの R で多様性の Blau インデックス (gini-simpson) を計算しようとしています。グループ内の各人に対して、「学生」、「教員」、「卒業生」、「該当なし」の範囲の値を持つ 6 つの列があります。グループが 6 より小さい場合は、列内にも NA があります。
na.rm= TRUE を使用して、各列内ではなく、行全体の Blau インデックス (グループ全体の多様性) を計算したいと思います。
Rでこれを行う方法を知っている人はいますか?
本当にありがとう!
python - Python の加重ジニ係数
https://stackoverflow.com/a/39513799/1840471からの Python でのジニ係数の簡単な実装を次に示します。
重みの配列を 2 番目のベクトルとして取得するには、これをどのように調整できますか? これは整数以外の重みを取る必要があるため、重みで配列を爆破するだけではありません。
例:
python - Scikit-Learnの決定木アルゴリズムで分割基準(ジニ/エントロピー)を修正するには?
私はバイナリ分類問題で決定木アルゴリズムを使用しており、目標は分類の誤検知 (最大化positive predicted value
) を最小限に抑えることです (診断ツールのコストは非常に高くなります)。
weight
偽陽性の誤分類にペナルティを課すために、ジニ/エントロピー分割基準を導入する方法はありますか?
ここでは、たとえば、修正されたジニ指数は次のように与えられます。
したがって、Scikit-learn でそれを実装する方法があるかどうか疑問に思っていますか?
編集
で遊ぶとclass_weight
、次の結果が得られました。
決定境界をプロットし、木Blue は正です (1) :
少数派のクラスを上回っている(またはより貴重な):
dt_100 = tree.DecisionTreeClassifier(max_depth=2, class_weight={1:100})