次のような documentTermMatrix があります。
artikel naam product personeel loon verlof
doc 1 1 1 2 1 0 0
doc 2 1 1 1 0 0 0
doc 3 0 0 1 1 2 1
doc 4 0 0 0 1 1 1
パッケージtmでは、2 つのドキュメント間のハミング距離を計算できます。しかし今、ハミング距離が 3 より小さいすべてのドキュメントをクラスター化したいと考えています。ここでは、クラスター 1 がドキュメント 1 と 2 であり、クラスター 2 がドキュメント 3 と 4 であることを望みます。それを行う可能性はありますか?