問題タブ [gini]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - rのビン化されたデータのジニ関数を計算するためのforループを作成する方法は?
ビン化された国勢調査データを使用してジニ係数を計算しようとすると、いくつかの問題が発生します。助けていただければ幸いです。
私のデータはこのように少し見えます (ただし、13 変数の 14,000 の観測があります)。
したがって、観測ごとに場所が指定され、次に、その地域で指定された所得区分内で稼いでいる世帯数を示す一連の列があります (つまり、場所 A では、20 世帯の収入は 0 ドル、13 世帯の収入は 1、27 世帯の収入は 2、0 収入は 3 です)。 )。
結果を返す空の列を作成しました。
df$gini = 0
次に、各収入ビンに使用する収入額を含む数値ベクトル (x) を作成しました。
私は reldist パッケージ内でジニ関数を使用しようとしており、次の for ループを記述して、データの各行を循環し、ジニ関数を適用して、出力を新しい列に返します。
問題は、返される出力が現在各行で同一であることです。これは明らかに正しくありません。私はこれに比較的慣れていませんが、何が間違っているのかわかりません...
syntax-error - Stata: ジニ係数の値を格納するための for ループ
収入に関する 133 の変数があります (各変数はグループを表します)。これらすべてのグループのジニ係数が必要なのでineqdeco
、Stata で使用します。これらの係数をすべて手作業で計算することはできないため、for ループを作成しました。
また、順序を変更してみました:
そしてi
事前に指定します:
とにかく、この最後の方法が機能するかどうかはわかりません。すべての場合で、エラーが発生します: weight not allowed r(101)
。これが何を意味するのか、何をすべきかわかりません。基本的に、133 個の変数すべてのジニ係数を計算し、これらの値を長さ 133 のベクトルに格納したいので、すべての係数が格納された単一の変数になります。
replace
編集:エラーはコマンドに関係していることがわかりました。この行を次のように置き換えました。
しかし、今は「ループ」しないので、 のすべてのエントリで最初の値を取得しますsgini
。
r - Rで行ごとにジニを計算する
スタックオーバーフロー。
長さ1326行のデータフレームの各行内のジニ係数を6列(1326 x 6)で計算しようとしています。
私の現在のコード...
... すべての行を同じ数字の 0.7522439 で埋めます - これは明らかに間違っています。
注: reldist パッケージの gini 関数を使用しています。
各行の 6 列のジニを計算する方法はありますか?
前もって感謝します。
random-forest - h2oランダムフォレストで「重要度」に使用される尺度は何ですか
これが私のコードです:
私が得ている出力は「変数の重要性」です。
古典的な尺度は、「精度の平均低下」と「ジニ係数の平均低下」です。
私の結果は次のとおりです。
このことから、「Vote #4」別名 V4 の相対的な重要性は ~3255.2 です。
質問: それは何の単位ですか? それはどのように導き出されるのですか?
ドキュメントを調べてみましたが、答えが見つかりません。ヘルプドキュメントを試しました。フローを使用してパラメーターを調べ、そこに何かが示されているかどうかを確認してみました。それらのどれにも「ジニ」または「精度の低下」はありません。どこを見ればいいですか?
r - R調査パッケージを使用した所得格差の測定
私はこのsurvey
パッケージを使用してAmerican Community Surveyのマイクロデータを扱っており、ベーシックインカムの不平等統計を計算したいと考えています。私は私のデザインとして以下を設定しました:
そこから、年ごとのジニ係数と所得の分位数比を年ごとに計算したいと思います。分位数と関連するエラーの生成は、 and を使用して簡単に行うことができsvyby
ますsvyquantile
。
それは私の最初の質問に私をもたらします: 各分位点の反復重みベースの誤差がある場合、収入の分位数の比率 (たとえば 90/10) の標準誤差を計算するにはどうすればよいですか? 使用してみsvyratio
ましたが、それは変数全体の比率であり、変数内の選択された観測値ではありません。
2 番目の質問: fromsurvey
のような既存の関数を使用して、ジニ係数 (レプリケート ベースのエラーを含む) を計算する方法はありますか? 使ってみたのですが、うまくいきませんでした。おそらく、引数を変数、次に重みとして並べているのですが、指示が逆の順序を指定しているためです。両方の方法を試しましたが、どちらもうまくいきませんでした。たとえば、HHWT はサンプルの重みです。gini
reldist
withReplicates
gini
withReplicates
これにより、次のエラー メッセージが表示されます。
r - パッケージ DescTools の Gini 関数を使用した整数オーバーフロー エラー
Gini()
fromを使用してジニ係数を計算したいのですがDescTools
(重み、信頼区間などを使用して「偏りのない」ジニ係数を簡単に計算できるため)、この関数を「大きな」サンプルで使用するとエラーが発生します。私の側でエラーを生成する簡単な例を次に示します。
警告メッセージ: 1: in sum(x * 1:n) : 整数オーバーフロー - sum(as.numeric(.)) を使用 2: In n * sum(x) : 整数オーバーフローによって生成された NA
何が問題なのかわかりません。私はRバージョン3.3.1(2016-06-21)を使用しています - RStudioバージョン0.99.903および「DescTools」バージョン0.99.17で「Bug in Your Hair」。
編集:まあ、私の数値を整数から数値に変換することはうまくいくようです(しかし、とにかく、私はまだそれを取得していません...):
python - SAS コード - GINI インデックスの作成方法を理解しようとしている
私はデータ サイエンス コンテストに参加しており、最終的な予測は GINI インデックスを介して測定されます。回帰問題です。SAS で計算するためのソース コードがありますが、SAS を知らず、何が起こっているのか理解できません。
私はPythonで同じものを作りたいです。どんな助けでも大歓迎です。誰かがこのための Python コードを知っていれば、大いに役立つでしょう。
r - RでCART(Decision Tree Algorithm)のGini Indexを計算する関数はありますか?
CART を使用するにあたり、Gini インデックスを使用して属性全体からプライマリ属性を選択したいと考えています。
しかし、それを含む関数やパッケージは見つかりませんでした。
ジニ指数を計算する関数やパッケージがあれば教えてください。