“lsa”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

254 参照

hadoop - SparseVectorsFromSequenceFiles、RowIdJob、および RowSimilarityJob ジョブのメモリ実装はありますか

SparseVectorsFromSequenceFilesMap/Reduce ジョブを実行する Mahout が提供する、RowIdJobおよびRowSimilarityJobHadoop ジョブを使用して、潜在的セマンティック分析の実行に取り組んできました。私は、単一のスレッドまたはできれば複数のスレッドで、メモリ内で実行されるこれらの機能の同等の実装を見つけようとしています。

そのようなことはありますか？

2012-07-02T07:52:42.100

0 投票する

1 に答える

725 参照

r - RのLSAパッケージのtextmatrix関数でエラーを回避する方法

私はこの Kaggle コンペティションに参加していますが、RのLSA パッケージのtextmatrix関数に詳しい人がいるかどうか疑問に思っています。

基本的に、textmatrix関数はディレクトリを引数として受け入れ、指定されたディレクトリ内で見つかったすべてのテキストファイルを使用して textmatrix を作成します。

残念ながら、textmatrix関数は、用語が含まれていないテキストファイルを検出するとエラーをスローします (たとえば、ストップワードを使用してフィルター処理した場合に発生する可能性があります)。

最終的に用語がゼロになるファイルをtextmatrix に無視させる簡単な方法を知っている人はいますか? または、これらのファイルを特定して削除する比較的迅速な方法はありますか?

ティア！

r kaggle lsa

user141146

2012-08-28T01:46:52.820

0 投票する

1 に答える

768 参照

sparse-matrix - 疎行列の pLSA 実装

Thomas Hoffman (1999) によって提案された pLSA アルゴリズムを実装しようとしています。ただし、私が見つけたすべての実装では、入力された term-doc マトリックスがスパースではなく完全であると見なされます。私の入力行列は非常に大きくて疎なので、疎性をサポートするアルゴリズムを見つけたいと思います。見つけるのを手伝ってくれませんか？Matlab または Java が推奨されます。

更新 PennAspect http://www.cis.upenn.edu/~ungar/Datamining/software_dist/PennAspect/index.html が実際にスパース行列入力で PLSA を実装していることがわかりました。

解決策は簡単です。2D 不規則配列 (各行の長さが同じではない配列) を使用して、疎行列を表すことができます。

sparse-matrix lsa topic-modeling

2012-09-11T20:01:40.180

0 投票する

2 に答える

1205 参照

lsa - LSAで計算された文間の類似性はどのようになっていますか？

単語間の類似度を計算するときにLSAがどのように機能するかを理解しました。ウェブサイトlsa.colorado.eduのLSAを使用していますが、文または複数の単語間の類似性がどのように計算されるかについてのソースが見つかりません。それは、すべてのペアごとの類似性を平均することによって行われるだけですか？

lsa

2012-12-17T14:59:24.023

0 投票する

2 に答える

2403 参照

routing - OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にある理由

OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にあるのはなぜですか。いくつかの歴史的な理由によるものだと思いますが、ググることはできません。

routing lsa ospf

2013-02-18T19:36:22.723

0 投票する

2 に答える

4073 参照

r - R-lsa パッケージを使用して、セマンティックスペース内のドキュメント間のコサイン類似度を計算します

R 言語を使用して同様のドキュメントをクラスター化しようとしています。最初のステップとして、ドキュメントセットの用語-ドキュメントマトリックスを計算します。次に、前に作成した用語ドキュメントマトリックスの潜在的な意味空間を作成します。用語と文書の行列だけを使用したクラスタリングの結果がひどかったため、実験で LSA を使用することにしました。作成された LSA 空間を使用して、非類似度行列 (余弦測定を使用) を作成することは可能ですか? これを行う必要があるのは、使用しているクラスタリングアルゴリズムが非類似度行列を入力として必要とするためです。

これが私のコードです：

LSA 空間から (余弦測定を使用して) 非類似度行列を構築する必要があるため、次のようにクラスターアルゴリズムを呼び出すことができます。

助言がありますか？

前もって感謝します！

r cluster-analysis text-mining trigonometry lsa

2013-03-05T16:52:43.530

0 投票する

1 に答える

325 参照

installshield - InstallShield 呼び出し advapi32.dll メソッドタイプの不一致エラー

基本的な MSI InstallShield コードから Advapi32.LsaOpenPolicy() を呼び出そうとしています。他の avdapi32.dll メソッドの呼び出しに成功しました。しかし、LsaOPenPolicy はタイプの不一致エラーをスローしています。

私のプロトタイプは次のとおりです。

ウィンドウの定義は次のとおりです。

C++ サンプルで、ObjectAttriibute 構造がゼロに設定されていることに注意しました。そこで、InstallShield コードで同様の処理を行います。pArray は配列の内容を指します。

スローされた 80020005 エラー以外の情報はあまりありません。いくつかの異なる引数の構成を試しましたが、これを乗り越えることができません。

これをフレクセラとマイクロソフトのフォーラムに投稿しましたが、そこには何の関心もありませんでした。(後世の参考文献: flexera-link、microsoft-link )

どんな助けや提案も大歓迎です!

installshield lsa

2013-03-29T17:44:57.040

0 投票する

2 に答える

983 参照

c# - Windows 環境での LSA\LSI のランダム化された SVD

私は、潜在意味解析 (LSA) の使用を含むプロジェクトに取り組んでいます。これには、特異値分解 (SVD) を使用する必要があり、大規模なデータセットの場合もあります。Windows\Visual Studio 環境で使用できるランダム化 SVD (rSVD) の実装はありますか? redsvd というプロジェクトを見ましたが、Linux でのみサポートされているようです。

c#svd lsa

2013-06-09T07:49:36.557

問題タブ [lsa]

Reference