2

次のような documentTermMatrix があります。

      artikel naam product personeel loon verlof    
 doc 1    1       1    2        1        0    0     
 doc 2    1       1    1        0        0    0    
 doc 3    0       0    1        1        2    1   
 doc 4    0       0    0        1        1    1   

パッケージtmでは、2 つのドキュメント間のハミング距離を計算できます。しかし今、ハミング距離が 3 より小さいすべてのドキュメントをクラスター化したいと考えています。ここでは、クラスター 1 がドキュメント 1 と 2 であり、クラスター 2 がドキュメント 3 と 4 であることを望みます。それを行う可能性はありますか?

4

1 に答える 1