“lda”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

6269 参照

matlab - Matlab - LDA 「TRAINING のプールされた共分散行列は正定値でなければなりません。」

誰かがこの問題で私を助けてくれますか? 私は長い間これを理解しようとしています。

私は training_Set:<1530*270400 double> と Test_Set:を持っています。<4794*270400 double>

線形判別分析法を使用しています

分類の使用エラー (228 行目)

TRAINING のプールされた共分散行列は正定でなければなりません。

2013-04-10T10:48:49.173

0 投票する

0 に答える

445 参照

python - ベイクオフパート 2: Cython で型指定されたメモリビューを使用した数学

メモリビューに格納されている値の配列に値を追加するような単純なことはできないようです。型付きメモリビューが行うべきことではないことを理解しています。しかし、メモリビューを np.array に戻すのは、亀が猫を放牧するよりも時間がかかります。

次のようなcdef関数を記述しようとすると:

メモリビューが連続していないというエラーが表示されます。

「ValueError: Buffer と memoryview が同じ次元で連続していません。」

これは、渡されたメモリビューがスライスされたものでない場合に実際に機能します。しかし、それはプロセスに 10 秒を追加します!

python performance numpy cython lda

2013-04-17T19:46:03.230

0 投票する

1 に答える

17333 参照

r - 新しいデータの LDA トピックの予測

この質問は以前に数回 (こことここで) 尋ねられたようですが、まだ回答がありません。コメントで示されているように、これは質問の以前のあいまいさが原因であることを願っています。もう一度同様の質問をしてプロトコルを破っている場合は申し訳ありませんが、それらの質問には新しい回答が表示されないだろうと思っていました.

とにかく、私は潜在的ディリクレ割り当てを初めて使用し、テキストデータの次元削減の手段としての使用を検討しています。最終的には、非常に大きな単語の袋から小さなトピックのセットを抽出し、それらのトピックをモデルのいくつかの変数として使用して分類モデルを構築したいと考えています。トレーニングセットで LDA を実行することに成功しましたが、問題は、同じトピックのどれが他のテストデータセットに現れるかを予測できることです。私は現在 R の topicmodels パッケージを使用していますが、他のパッケージを使用して別の方法がある場合は、それも受け入れます。

これが私がやろうとしていることの例です:

r lda topic-modeling

2013-04-20T00:01:58.400

0 投票する

1 に答える

1788 参照

python - gensim を使用したトレーニング用コーパスへの LDA の適用

約 20,000 のドキュメントを含むコーパスがあり、LDA を使用してトピックモデリング用にそのデータセットをトレーニングする必要があります。

このプログラムを実行するたびに、次のエラーが発生します。

関数の値を変更しようとしましたLdaModelが、常に同じエラーが発生します!

何をすべきですか？

python nlp gensim lda topic-modeling

2013-04-28T04:37:21.523

0 投票する

3 に答える

15966 参照

python - gensim を使用してトレーニングされた LDA モデルを使用して、新しいクエリのトピックを予測する方法は?

gensim を使用して LDA トピックモデリング用のコーパスをトレーニングしました。

gensim ウェブサイトのチュートリアル (これはコード全体ではありません):

これは私が得る出力です：

question最後の出力が、 !!!の可能なトピックを見つけるのにどのように役立つかわかりません。

助けてください！

python nlp lda topic-modeling gensim

2013-04-28T10:39:43.780

0 投票する

1 に答える

5860 参照

r - R トピックモデリング: lda モデルのラベル付け機能

LDA を使用して、A と B という 2 つのテキストドキュメントのトピックモデルを構築しました。ドキュメント A はコンピューターサイエンスとの関連性が高く、ドキュメント B は地球科学との関連性が高いと言えます。次に、次のコマンドを使用してldaをトレーニングしました：

my_lda を使用して、C などの新しいドキュメントのコンテキストを予測し、それがコンピューターサイエンスまたは地球科学に関連しているかどうかを確認したいと考えています。このコードを予測に使用するかどうかはわかっています

ラベル 1 または 2 が付けられますが、1 または 2 が何を表しているのかわかりません... それがコンピューターサイエンス関連または地球科学関連を意味する場合、どうすればわかりますか?

r lda topic-modeling

2013-05-06T09:48:47.720

0 投票する

1 に答える

491 参照

python - (Gensim) ValueError: 無効な形状、アルファパラメータ付き

まず、これは LDA が実行されたコーパスのトピック分布を取得する正しい方法ですか?

この問題は、アルファパラメータを LDA に追加し、次のようにコーパスをスパースマトリックスに変換しようとすると発生します。

gensim コーパスから 3 行目の疎行列への変換中に、エラーが発生します。ValueError: invalid shape

ALPHA パラメータを追加した場合にのみ、この問題が発生します。

完全なトレースバック:

python lda gensim

2013-05-12T17:00:00.123

0 投票する

1 に答える

6621 参照

python - PyCharmのGensim ImportError:scipy.sparseという名前のモジュールはありません

私は Mac OS X 10.8.3 (Mountain Lion) を使用しており、PyCharm でスクリプトを実行しようとしています。Python 2.7.2 がインストールされています。Canopy と Gensim をインストールしました。私が得ているエラーの原因が何であるかを理解していません。

v0.11がインストールされていることを示しています。

スクリプトを実行した後の出力全体を次に示します。

python scipy pycharm lda gensim

2013-05-14T21:35:04.413

問題タブ [lda]

Reference