2

data frame列が論理変数である Rがあります。可能なすべての列のペア間である種の内積を作成する必要があります。

これは、データ フレームがどの用語 (行) がどのドキュメント (列) に存在するかを示すテキスト コーパス分析から生じます。daisyfromclusterパッケージまたはcosinefromパッケージを使用して、考えられる列の各ペアとの距離を計算したい場合には、一般的で高速なソリューションがありlsaます。

ただし、代わりにすべての列のペア間である種の内積を使用する必要があります。目標は、比較された両方のドキュメントに同時に存在する単語の数をカウントすることです (これは、ペアごとに)。

4

1 に答える 1

4

この例を使用してみましょう:

df <- data.frame(x1 = c(T, T, F), x2 = c(F, F, F), x3 = c(T, F, T))

data.frame を行列に変換してから、クロス積を計算します。

crossprod(data.matrix(df))
#    x1 x2 x3
# x1  2  0  1
# x2  0  0  0
# x3  1  0  2
于 2014-05-24T21:52:17.897 に答える