“unsupervised-learning”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

1606 参照

machine-learning - 時系列データの教師なし学習における最先端技術とは?

最先端の方法の概要を探しています

時系列データの時系列パターン (任意の長さ) を見つける
教師なし(ラベルなし) です。

言い換えれば、(潜在的に高次元の) データのストリーム/シーケンスが与えられた場合、データ内の構造を最もよく捉える共通のサブシーケンスをどのように見つけますか?

最近の開発や論文 (できれば HMM を超えたもの) へのポインタは大歓迎です!
この問題は、より具体的なアプリケーションドメインでよく理解されていますか?
- モーションキャプチャ
- 音声処理
- 自然言語処理
- ゲームのアクションシーケンス
- 株価予想？
さらに、これらの方法のいくつかは、対処するのに十分一般的ですか?
- ノイズの多いデータ
- 階層構造
- 時間軸上で不規則な間隔

(既知のパターンを検出することにも、シーケンスを分類またはセグメント化することにも興味がありません。)

2012-08-07T21:06:12.047

0 投票する

1 に答える

272 参照

matlab - matlabのk-meanは、シードのクラスターメンバーシップを再計算しますか？

matlab's k-meanシードについての詳細がわかりません。matlabのk-meanが、行列Xs seedsのサブセットであるのクラスター割り当てを再計算する場合。data set X

または、これらのシードは最初の中心位置にのみ使用され、k-meansクラスター割り当てフェーズでは考慮されませんか？

semi-supervised clustering by seedsスガト・バスーらがやりたいです。素朴な質問かもしれませんが、あなたの答えはこの混乱をより明確にするでしょう。

前もって感謝します。

matlab statistics cluster-analysis k-means unsupervised-learning

2012-08-28T12:32:25.430

0 投票する

2 に答える

4192 参照

machine-learning - データセットで教師なし学習手法を使用し、クラスターにラベルを付けるにはどうすればよいでしょうか?

まず、これは間違いなく宿題です (したがって、完全なコードサンプルはありません)。それは言った...

Matlab のニューラルネットワークツールボックスを使用して、教師ありアルゴリズムの隣に教師なしアルゴリズムをテストする必要があります。データセットはUCI人工文字データベースです。問題は、私は教師ありアルゴリズムに関する優れたチュートリアルを持っていたのに、教師なしアルゴリズムに取り残されたことです。

を使用して自己組織化マップを作成する方法を知っているので、を使用し selforgmapてそれをトレーニングしtrain(net, trainingSet)ます。次に何をすべきかわかりません。私が与えたデータが（うまくいけば）10個のクラスター（文字ごとに1つ）にクラスター化されていることを知っています。

次に2つの質問：

次に、クラスターにラベルを付けるにはどうすればよいですか (比較パターンがある場合)。
- これを行うとき、これを教師あり学習の問題に変えようとしていますか?
教師ありアルゴリズムと比較するために、(別の) テストセットで混同行列を作成するにはどうすればよいですか?

ここでは、概念的または専門用語に基づいた何かが欠けていると思います。私の検索はすべて、教師あり学習手法を思いつきます。正しい方向へのポイントは大歓迎です。私の既存のコードは以下の通りです：

machine-learning neural-network matlab unsupervised-learning

2012-10-09T03:46:21.513

0 投票する

1 に答える

1993 参照

python - NLTKによる半教師ありナイーブベイズ

EM（期待値最大化アルゴリズム）に基づいて、PythonでNLTKのナイーブベイズの半教師ありバージョンを作成しました。ただし、EMの一部の反復では、負の対数尤度が得られます（EMの対数尤度はすべての反復で正でなければなりません）。したがって、コードにいくつかの間違いがあるはずです。コードを注意深く確認した後、なぜこれが起こっているのかわかりません。誰かが以下の私のコードの間違いを見つけることができれば本当にありがたいです：

（半教師ありナイーブベイズの参考資料）

EMアルゴリズムのメインループ

必要な度数分布を作成するために使用されるカスタム関数gen-freqdists

python machine-learning nltk naivebayes unsupervised-learning

2012-10-23T13:55:20.837

0 投票する

1 に答える

3990 参照