data frame
列が論理変数である Rがあります。可能なすべての列のペア間である種の内積を作成する必要があります。
これは、データ フレームがどの用語 (行) がどのドキュメント (列) に存在するかを示すテキスト コーパス分析から生じます。daisy
fromcluster
パッケージまたはcosine
fromパッケージを使用して、考えられる列の各ペアとの距離を計算したい場合には、一般的で高速なソリューションがありlsa
ます。
ただし、代わりにすべての列のペア間である種の内積を使用する必要があります。目標は、比較された両方のドキュメントに同時に存在する単語の数をカウントすることです (これは、ペアごとに)。