問題タブ [gini]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - OVER ステートメントを使用した複雑な GROUP BY の SQL 構文: 複数セットのジニ係数の計算
#cits
値とセット ID を含む2 列のテーブル (ここでは と呼ばれる) に含まれる、いくつかのセットのジニ係数を計算したいと考えています。ここ (StackExchange クエリ)とここ (StackOverflow の質問といくつかの適切な回答)で説明されている、さまざまなジニ係数の計算を試しています。GROUP BY
両方の例では、1 つのテーブルに対して 1 つの係数のみを計算しますが、節を使用して計算したいと考えています。
テーブルには との#cits
2 つの列がc
ありcid
、それぞれ値とセット ID です。
これが私の現在の試みです(不完全):
もちろん、numC と totalC の選択はうまく機能しますが、次の行が頭を悩ませています。row_number()
構文が間違っていることはわかりますが、 per c per cidを割り当てる方法がわかりません。
編集:提案に基づいて、次のpartition
ように使用しました:
これはほとんど機能します。結果は得られますが、ジニ係数は 0 から 1 の間である必要があるため、予想外の >1 です。何とも重大な問題。
r - Rpart 分割エラー: 引数の分割が一致しません
rpart
関数の分割方法を「ジニ」(デフォルト)から「情報」に変更したい。
ヘルプ セクションには、次の例があります。
method
引数の詳細には次のように記載されています。
およびparms
引数の詳細では、「分割インデックスはジニまたは情報にすることができます。デフォルトの事前確率はデータカウントに比例し、損失のデフォルトは 1 であり、分割のデフォルトはジニです。」
モデルを作成しようとすると:
この (およびほとんどの) R ヘルプ セクションはあまり明確ではありません。どうやら私には情報オプションがありません。前に分割の関数を定義してからモデルを構築することになっていますか?それとも確率ベクトルを入力しますか? 例のような情報をどのように使用できますか?
r - Rのジニ指数
データベースの各行の Gini インデックスを計算しようとしています。各行は顧客で、各列は月間セッションです。だから私がする必要があるのは、12 か月間の顧客ごとに、行ごとに Gini インデックスを含む列を追加することです。 添付の例を参照
オンラインでいくつかの例を見つけて、これを行いました:
ただし、次のエラーが表示されます。
match.fun(FUN) のエラー: オブジェクト 'gini' が見つかりません
Ineq と Reldist (およびライブラリ) の両方をインストールしたので、これが機能しない理由がわかりません。
python - sklearnでジニ係数を取得するにはどうすればよいですか
私はsklearnパッケージで、虹彩データなどのパスのクラスで各機能のジニ係数を見つけたいと思います。Iris-virginica のように 花弁の長さのジニ:0.4 ,花弁の幅のジニ:0.4.
formula - fastgini におけるジニ係数の計算式
fastgini
Stata のパッケージ ( https://ideas.repec.org/c/boc/bocode/s456814.html )を使用します。
私は、Karagiannis & Kovacevic (2000) ( http://onlinelibrary.wiley.com/doi/10.1111/1468-0084.00163/abstract )などで報告されているジニ係数の古典的な式に精通しています。
フォーミュラ I:
ここで、G はジニ係数、μ は分布の平均値、N はサンプル サイズ、y_i は i 番目のサンプル単位の収入です。したがって、ジニ係数は、データ内のすべての利用可能な収入ペア間の差を計算し、すべての絶対差の合計を計算します。
次に、この合計を人口の 2 乗に平均所得を掛けた値で割って正規化します (さらに 2 倍しますか?)。
ジニ係数の範囲は 0 から 1 で、0 は完全な平等 (すべての個人が同じ所得を得る) を意味し、1 は最大の不平等 (1 人がその国のすべての所得を得る) を意味します。
ただし、fastgini
パッケージは別の式を参照しています ( http://fmwww.bc.edu/repec/bocode/f/fastgini.html ):
フォーミュラ II:
ここで、観測は X の昇順で並べ替えられます。
ここで、W は重みのようですが、使用していません。したがって、1 (?) にする必要があります。式 I と式 II が同じかどうかはわかりません。絶対的な差はなく、結果は式 II の 1 から差し引かれます。方程式を変換しようとしましたが、それ以上は得られません。
両方の計算方法 (式 I + 式 II) が同等であるかどうか、ヒントを教えてもらえますか?