そのため、このクラスタリング出力を解釈/分析する方法を見つけようとしています。clusters-0、clusters-1、clusters-2 などと呼ばれる 50 個のフォルダーがあります。これは、コマンドで「-k 50」と言ったためです。これらのフォルダーにはそれぞれ 1 つのクラスターが含まれていると思っていましたが、今はわかりません。
'--help' kmeans を使用すると、'-cl' スイッチは次のようになります。「存在する場合は、反復が行われた後にクラスタリングを実行します。」
では、実際にクラスタリングを行うには「-cl」を使用する必要があるということですか?
「-cl」が使用されていない場合、これらの 50 個のフォルダーはすべて、k-means アルゴリズム出力の単なる反復であり、実際に clustersを含む出力は生成されません。
これらの各フォルダーには 50 個のクラスターが含まれており、最後のフォルダーは最適で最も洗練されたクラスターのセットですか?