data.frame
2 つのバイナリ変数と 13109 個の obs を持つ Comp1 という名前の独立性のカイ 2 乗検定を作成しています。
人口統計に基づいて消費者をクラスタリングする前にテストを使用しています。2 つの変数が相互に依存している場合、特定の値がクラスター内に存在します。data.frame
2 つの変数は、 36 個の変数を持つ別の変数のサブセットです。
関数が示すのではなく、変数がdata.frame
あったというエラーが表示されました。character
factors
str()
data.frame
にcharacter
値があるとエラーが表示されるのはなぜですか?
データ:
> str(Comp1)
'data.frame': 13109 obs. of 2 variables:
$ HomeOwnerStatus: Factor w/ 2 levels "Own","Rent": 1 2 2 2 1 2 1 1 2 2 ...
$ MaritalStatus : Factor w/ 2 levels "Married","Single": 2 1 1 1 2 1 2 1 1 1 ...
例:
> #Create dataset
> homeownerstatus <- c("Own", "Rent", "Own", "Own", "Rent", "Own")
> maritalstatus <- c("Married", "Married", "Married", "Single", "Single", "Married")
> Comp1 <- data.frame(homeownerstatus, maritalstatus)
解決策のエラー:
> #Test binary variables for independence
> #Create matrix from data.frame
> DF4 <- as.matrix(Comp1)
> #Comparison of marital status and home owner status
> #Perform chi-squared test for independence of two variables
> chisq.test(table(Comp1))
Chi-squared test for given probabilities
data: table(DF4)
X-squared = 295149.5, df = 71, p-value < 2.2e-16