問題タブ [cluster-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - MATLAB: 自己組織化マップ (SOM) クラスタリング
体の部分間の角度に応じて、いくつかの画像をクラスター化しようとしています。
各画像から抽出された特徴は次のとおりです。
したがって、入力データはサイズが 1057x10 の行列です。ここで、1057 は画像の数を表し、10 は体のパーツと胴体の角度を表します。同様に、testSet は 821x10 マトリックスです。
入力データのすべての行を 88 個のクラスターでクラスター化する必要があります。次に、これらのクラスターを使用して、TestData がどのクラスターに分類されるかを見つけますか?
以前の作業では、非常に単純なK-Means クラスタリングを使用しました。K-Means にデータを 88 個のクラスターにクラスター化するように依頼するだけです。また、テスト データの各行と各クラスターの中心との間の距離を計算する別の方法を実装し、最小値を選択します。これは、対応する入力データ行のクラスターです。
2 つの質問があります。
MATLAB でSOMを使用してこれを行うことは可能ですか? AFAIK SOMはビジュアルクラスタリング用です。ただし、各クラスターの実際のクラスを知る必要があるため、後でテスト データが属するクラスターを計算してラベルを付けることができます。
より良い解決策はありますか?
cluster-analysis - ファジーcはMATLABで意味します
組み込みのファジーcは、クラスターの中心C、Uファジーパーティション行列を返すアルゴリズムを使用して、MATLABでいくつかのデータをクラスター化しています。したがって、Cのクラスターセンターが何であるかはわかりますが、各データポイントがどのクラスターセンターに属しているかをどのように把握できますか?ファジーパーティションマトリックスまたは他の方法を使用していますか?
python - Pythonでのテキストのクラスタリング
私はいくつかのテキストドキュメントをクラスター化する必要があり、さまざまなオプションを研究してきました。LingPipeは(ベクトル空間などへの)事前の変換なしでプレーンテキストをクラスター化できるように見えますが、文字列で機能すると明示的に主張しているのは私が見た唯一のツールです。
テキストを直接クラスター化できるPythonツールはありますか?そうでない場合、これを処理するための最良の方法は何ですか?
cluster-analysis - k-means クラスタリングを使用する場合、k を決定するにはどうすればよいですか?
私はk-means clusteringについて研究してきましたが、明確でないことの 1 つは、k の値をどのように選択するかです。それは単なる試行錯誤の問題ですか、それともそれ以上のことはありますか?
artificial-intelligence - AI 技術を使用したファイル形式のリバース エンジニアリング
これは質問を拡張するためのものです:バイナリ ファイル形式のリバース エンジニアリングを支援するツール
クラスタリングやデータ マイニング技術を使用してファイル形式をリバース エンジニアリングする、公開されているツールはありますか?
たとえば、ツールを使用すると、同じ形式のファイルのコレクションがあり、ツールの出力は一般的な構造になりますか?
indexing - mahout lucene ドキュメント クラスタリング ハウツー?
mahout クラスタリング アルゴリズムを適用するために使用できる lucene インデックスから mahout ベクトルを作成できることを読んでいます。 http://cwiki.apache.org/confluence/display/MAHOUT/Creating+Vectors+from+Text
Lucene インデックスのドキュメントに K-means クラスタリング アルゴリズムを適用したいのですが、このアルゴリズム (または階層クラスタリング) を適用して、これらのドキュメントで意味のあるクラスタを抽出する方法が明確ではありません。
このページhttp://cwiki.apache.org/confluence/display/MAHOUT/k-Means は、アルゴリズムが 2 つの入力ディレクトリを受け入れると述べています。1 つはデータ ポイント用、もう 1 つは初期クラスター用です。私のデータポイントはドキュメントですか? これらが私のドキュメント (またはそのベクトル) であることを「宣言」するにはどうすればよいですか?
文法が下手で申し訳ありません
ありがとうございました
matlab - matlabで視覚的にデータを2つのクラスに分割する
各クラスターには x、y (座標) と、そのタイプ (1 クラス 1,2 クラス 2) を知るための値がある 2 つのデータ クラスターがあります。これらのデータをプロットしましたが、これらのクラスを境界 (視覚的に) で分割したいと思います。そのようなことをする機能は何ですか。輪郭を試してみましたが、役に立ちませんでした!
c++ - OpenCVのクラスタリング関数cvKMeans2()-配列内のクラスターセンターのタイプは何ですか?
クラスタリングにOpenCVライブラリの関数cvKMeans2()を使用しています。オプションのパラメーターがあります: centers-クラスター
中心のオプションの出力配列
同じパラメーターが関数kmeans()にもあります。
クラスターに関する情報を知りたい。しかし、配列内のそのクラスターセンターのタイプが何であるかがわからないため、取得できません。
アドバイスありがとうございます!