r - r の計算に使用されるサンプルサイズをどのように見つけますか?

Question

変数間の相関関係を実行していますが、その一部にはデータが欠落しているため、各相関関係のサンプルサイズは異なる可能性があります。印刷と要約を試みましたが、どちらも相関ごとに n がどれだけ大きいかを示していません。これは、どこにも答えが見つからない、かなり単純な問題です。

score 3 · Accepted Answer

このような..？

x <- c(1:100,NA)
length(x)
length(x[!is.na(x)])

このように自由度を取得することもできます...

y <- c(1:100,NA)
x <- c(1:100,NA)

cor.test(x,y)$parameter

しかし、正確な助けを得るために、相関関係をどのように推定しているかのコードを示すのが最善だと思います。

score 1 · Accepted Answer

行列の列間でペアワイズサンプルサイズを見つける方法の例を次に示します。データフレームの（特定の）数値列に適用する場合は、それに応じてそれらを組み合わせ、結果のオブジェクトを強制的に行列にして、関数を適用します。

# Example matrix:
xx <- rnorm(3000)
# Generate some NAs
vv <- sample(3000, 200)
xx[vv] <- NA
# reshape to a matrix
dd <- matrix(xx, ncol = 3)
# find the number of NAs per column
apply(dd, 2, function(x) sum(is.na(x)))
# tack on some column names
colnames(dd) <- paste0("x", seq(3))

# Function to find the number of pairwise complete observations 
# among all pairs of columns in a matrix. It returns a data frame
# whose first two columns comprise all column pairs

pairwiseN <- function(mat)
{
    u <- if(is.null(colnames(mat))) paste0("x", seq_len(ncol(mat))) else colnames(mat)
    h <- expand.grid(x = u, y = u)

    f <- function(x, y)
           sum(apply(mat[, c(x, y)], 1, function(z) !any(is.na(z))))
    h$n <- mapply(f, h[, 1], h[, 2])
    h
}

# Call it
pairwiseN(dd)

機能は簡単に改善できます。たとえば、h <- expand.grid(x = u[-1], y = u[-length(u)])計算回数を減らすように設定したり、3 列のデータフレームの代わりに nxn 行列を返したりすることができます。

score -1 · Accepted Answer

あなたの変数がaおよびという名前のベクトルである場合、b何かsum(is.na(a) | is.na(b))助けになりますか?

r - r の計算に使用されるサンプル サイズをどのように見つけますか?

3 に答える 3

Related

Reference

r - r の計算に使用されるサンプルサイズをどのように見つけますか?