kmeans クラスタリングにオレンジを使用する予定です。チュートリアルを完了しましたが、まだ質問したいことがいくつかあります。
高次元のベクトルのクラスタリングを扱っています。1) コサイン距離は実装されていますか? 2) 空の値にゼロを与えたくありません。空のフィールドにゼロを入れないようにしましたが、エラーが発生しています:
SystemError: 'orange.TabDelimExampleGenerator': the number of attribute types does not match the number of attributes
空の値を示すにはどうすればよいですか? 3) 例のテーブルに「ID」を組み込む方法はありますか? 簡単に参照できるように、データを ID (分類ではなく) でラベル付けしたいと考えています。私は、ID 列を私のデータの公式部分とはしません。
4) kmeans クラスタリングで別の方法で出力する方法はありますか? 私はこの形式で何かを好むだろう:
cluster1: [ <id1>, <id2>, ...]
cluster2: [ <id3>, ... ]
rather than just [1, 2, 3,1 , 2, ... ]
ありがとう!