問題タブ [lsa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - SparseVectorsFromSequenceFiles、RowIdJob、および RowSimilarityJob ジョブのメモリ実装はありますか
SparseVectorsFromSequenceFiles
Map/Reduce ジョブを実行する Mahout が提供する、RowIdJob
およびRowSimilarityJob
Hadoop ジョブを使用して、潜在的セマンティック分析の実行に取り組んできました。私は、単一のスレッドまたはできれば複数のスレッドで、メモリ内で実行されるこれらの機能の同等の実装を見つけようとしています。
そのようなことはありますか?
r - RのLSAパッケージのtextmatrix関数でエラーを回避する方法
私はこの Kaggle コンペティションに参加していますが、RのLSA パッケージのtextmatrix関数に詳しい人がいるかどうか疑問に思っています。
基本的に、textmatrix関数はディレクトリを引数として受け入れ、指定されたディレクトリ内で見つかったすべてのテキスト ファイルを使用して textmatrix を作成します。
残念ながら、textmatrix関数は、用語が含まれていないテキスト ファイルを検出するとエラーをスローします (たとえば、ストップ ワードを使用してフィルター処理した場合に発生する可能性があります)。
最終的に用語がゼロになるファイルをtextmatrix に無視させる簡単な方法を知っている人はいますか? または、これらのファイルを特定して削除する比較的迅速な方法はありますか?
ティア!
sparse-matrix - 疎行列の pLSA 実装
Thomas Hoffman (1999) によって提案された pLSA アルゴリズムを実装しようとしています。ただし、私が見つけたすべての実装では、入力された term-doc マトリックスがスパースではなく完全であると見なされます。私の入力行列は非常に大きくて疎なので、疎性をサポートするアルゴリズムを見つけたいと思います。見つけるのを手伝ってくれませんか?Matlab または Java が推奨されます。
更新 PennAspect http://www.cis.upenn.edu/~ungar/Datamining/software_dist/PennAspect/index.html が実際にスパース行列入力で PLSA を実装していることがわかりました。
解決策は簡単です。2D 不規則配列 (各行の長さが同じではない配列) を使用して、疎行列を表すことができます。
lsa - LSAで計算された文間の類似性はどのようになっていますか?
単語間の類似度を計算するときにLSAがどのように機能するかを理解しました。ウェブサイトlsa.colorado.eduのLSAを使用していますが、文または複数の単語間の類似性がどのように計算されるかについてのソースが見つかりません。それは、すべてのペアごとの類似性を平均することによって行われるだけですか?
routing - OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にある理由
OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にあるのはなぜですか。いくつかの歴史的な理由によるものだと思いますが、ググることはできません。
r - R-lsa パッケージを使用して、セマンティック スペース内のドキュメント間のコサイン類似度を計算します
R 言語を使用して同様のドキュメントをクラスター化しようとしています。最初のステップとして、ドキュメント セットの用語-ドキュメント マトリックスを計算します。次に、前に作成した用語ドキュメント マトリックスの潜在的な意味空間を作成します。用語と文書の行列だけを使用したクラスタリングの結果がひどかったため、実験で LSA を使用することにしました。作成された LSA 空間を使用して、非類似度行列 (余弦測定を使用) を作成することは可能ですか? これを行う必要があるのは、使用しているクラスタリング アルゴリズムが非類似度行列を入力として必要とするためです。
これが私のコードです:
LSA 空間から (余弦測定を使用して) 非類似度行列を構築する必要があるため、次のようにクラスター アルゴリズムを呼び出すことができます。
助言がありますか?
前もって感謝します!
installshield - InstallShield 呼び出し advapi32.dll メソッド タイプの不一致エラー
基本的な MSI InstallShield コードから Advapi32.LsaOpenPolicy() を呼び出そうとしています。他の avdapi32.dll メソッドの呼び出しに成功しました。しかし、LsaOPenPolicy はタイプの不一致エラーをスローしています。
私のプロトタイプは次のとおりです。
ウィンドウの定義は次のとおりです。
C++ サンプルで、ObjectAttriibute 構造がゼロに設定されていることに注意しました。そこで、InstallShield コードで同様の処理を行います。pArray は配列の内容を指します。
スローされた 80020005 エラー以外の情報はあまりありません。いくつかの異なる引数の構成を試しましたが、これを乗り越えることができません。
これをフレクセラとマイクロソフトのフォーラムに投稿しましたが、そこには何の関心もありませんでした。(後世の参考文献: flexera-link、microsoft-link )
どんな助けや提案も大歓迎です!
c# - Windows 環境での LSA\LSI のランダム化された SVD
私は、潜在意味解析 (LSA) の使用を含むプロジェクトに取り組んでいます。これには、特異値分解 (SVD) を使用する必要があり、大規模なデータ セットの場合もあります。Windows\Visual Studio 環境で使用できるランダム化 SVD (rSVD) の実装はありますか? redsvd というプロジェクトを見ましたが、Linux でのみサポートされているようです。