ガラガラで記述統計を実行し、結果に含まれる「情報」を知る必要があります。ビネットで情報を見つけることができませんでした。これが私が話していることの例です:
変数1 n 一意の 情報が欠落しています 合計 平均 89588 0 2 0.61 25735 0.2873
0 ~ 1 のスコアであると考えていますが、正確な定義を見つけることができません。
Rattle で使用される describe 関数は、パッケージ HMisc に由来します。
HMisc::describe のドキュメントでは、Info について次のように述べられています。
数値変数の場合、describe は Info と呼ばれる項目を追加します。これは、変数に対する比例オッズ/Wilcoxon 検定の相対効率を使用した相対的な情報量であり、同順位のない変数に対する同じ検定と比較します。情報は、変数の連続性に関連しており、同点は、未同点の値が多いほど害が少なくなります。Info の式は、1 から値の相対度数の 3 乗の和を引いたものを 1 で割り、サンプル サイズの逆数の 2 乗を引いたものです。最も低い情報は、一意の値が 1 つしかない変数から得られ、その後に大きく歪んだバイナリ変数が続きます。情報は小数点以下 2 桁まで報告されます。