0

R を使用して、次のようなデータの階層的クラスタリングを実行したいと考えています。

     L1   L2   L3
W1   p    pr   r
W2   p    NA   r

これは、L2 が機能 W1 を L1 と L3 の両方と共有し、機能 W2 が L1 と L3 に存在するが、値が異なり、L2 には存在しないことを意味すると考えられます。(編集L は言語、W はこれらの言語の単語の語幹であり、値 (p、r など) は、これらの単語が特定の言語でどのように派生するかを示しています。異なる言語は共通の起源を示唆するかもしれません. それが欠けている場合, それは明確ではありません: それは何かを意味しているかもしれません, または私の情報源が不完全であるかもしれません.ステムがそれらに存在し、それらがどのように動作するか. end edit )

このデータを変換して分類を実行できるようにする方法を説明し、どの類似性指標を使用すべきかアドバイスしていただけますか?

4

0 に答える 0