問題タブ [lda]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
6269 参照

matlab - Matlab - LDA 「TRAINING のプールされた共分散行列は正定値でなければなりません。」

誰かがこの問題で私を助けてくれますか? 私は長い間これを理解しようとしています。

私は training_Set:<1530*270400 double> と Test_Set:を持っています。<4794*270400 double>

線形判別分析法を使用しています

分類の使用エラー (228 行目)

TRAINING のプールされた共分散行列は正定でなければなりません。

0 投票する
0 に答える
445 参照

python - ベイクオフ パート 2: Cython で型指定されたメモリビューを使用した数学

メモリ ビューに格納されている値の配列に値を追加するような単純なことはできないようです。型付きメモリビューが行うべきことではないことを理解しています。しかし、メモリ ビューを np.array に戻すのは、亀が猫を放牧するよりも時間がかかります。

次のようなcdef関数を記述しようとすると:

メモリビューが連続していないというエラーが表示されます。

「ValueError: Buffer と memoryview が同じ次元で連続していません。」

これは、渡されたメモリ ビューがスライスされたものでない場合に実際に機能します。しかし、それはプロセスに 10 秒を追加します!

0 投票する
1 に答える
17333 参照

r - 新しいデータの LDA トピックの予測

この質問は以前に数回 (ここ とここで) 尋ねられたようですが、まだ回答がありません。コメントで示されているように、これは質問の以前のあいまいさが原因であることを願っています。もう一度同様の質問をしてプロトコルを破っている場合は申し訳ありませんが、それらの質問には新しい回答が表示されないだろうと思っていました.

とにかく、私は潜在的ディリクレ割り当てを初めて使用し、テキストデータの次元削減の手段としての使用を検討しています。最終的には、非常に大きな単語の袋から小さなトピックのセットを抽出し、それらのトピックをモデルのいくつかの変数として使用して分類モデルを構築したいと考えています。トレーニング セットで LDA を実行することに成功しましたが、問題は、同じトピックのどれが他のテスト データ セットに現れるかを予測できることです。私は現在 R の topicmodels パッケージを使用していますが、他のパッケージを使用して別の方法がある場合は、それも受け入れます。

これが私がやろうとしていることの例です:

0 投票する
1 に答える
1788 参照

python - gensim を使用したトレーニング用コーパスへの LDA の適用

約 20,000 のドキュメントを含むコーパスがあり、LDA を使用してトピック モデリング用にそのデータ セットをトレーニングする必要があります。

このプログラムを実行するたびに、次のエラーが発生します。

関数の値を変更しようとしましたLdaModelが、常に同じエラーが発生します!

何をすべきですか?

0 投票する
3 に答える
15966 参照

python - gensim を使用してトレーニングされた LDA モデルを使用して、新しいクエリのトピックを予測する方法は?

gensim を使用して LDA トピック モデリング用のコーパスをトレーニングしました。

gensim ウェブサイトのチュートリアル (これはコード全体ではありません):

これは私が得る出力です:

question最後の出力が、 !!!の可能なトピックを見つけるのにどのように役立つかわかりません。

助けてください!

0 投票する
1 に答える
5860 参照

r - R トピック モデリング: lda モデルのラベル付け機能

LDA を使用して、A と B という 2 つのテキスト ドキュメントのトピック モデルを構築しました。ドキュメント A はコンピューター サイエンスとの関連性が高く、ドキュメント B は地球科学との関連性が高いと言えます。次に、次のコマンドを使用してldaをトレーニングしました:

my_lda を使用して、C などの新しいドキュメントのコンテキストを予測し、それがコンピューター サイエンスまたは地球科学に関連しているかどうかを確認したいと考えています。このコードを予測に使用するかどうかはわかっています

ラベル 1 または 2 が付けられますが、1 または 2 が何を表しているのかわかりません... それがコンピューター サイエンス関連または地球科学関連を意味する場合、どうすればわかりますか?

0 投票する
1 に答える
491 参照

python - (Gensim) ValueError: 無効な形状、アルファ パラメータ付き

まず、これは LDA が実行されたコーパスのトピック分布を取得する正しい方法ですか?

この問題は、アルファ パラメータを LDA に追加し、次のようにコーパスをスパース マトリックスに変換しようとすると発生します。

gensim コーパスから 3 行目の疎行列への変換中に、エラーが発生します。ValueError: invalid shape

ALPHA パラメータを追加した場合にのみ、この問題が発生します。

完全なトレースバック:

0 投票する
1 に答える
6621 参照

python - PyCharmのGensim ImportError:scipy.sparseという名前のモジュールはありません

私は Mac OS X 10.8.3 (Mountain Lion) を使用しており、PyCharm でスクリプトを実行しようとしています。Python 2.7.2 がインストールされています。Canopy と Gensim をインストールしました。私が得ているエラーの原因が何であるかを理解していません。

v0.11がインストールされていることを示しています。

スクリプトを実行した後の出力全体を次に示します。