問題タブ [lsa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sparse-matrix - 疎行列の pLSA 実装
Thomas Hoffman (1999) によって提案された pLSA アルゴリズムを実装しようとしています。ただし、私が見つけたすべての実装では、入力された term-doc マトリックスがスパースではなく完全であると見なされます。私の入力行列は非常に大きくて疎なので、疎性をサポートするアルゴリズムを見つけたいと思います。見つけるのを手伝ってくれませんか?Matlab または Java が推奨されます。
更新 PennAspect http://www.cis.upenn.edu/~ungar/Datamining/software_dist/PennAspect/index.html が実際にスパース行列入力で PLSA を実装していることがわかりました。
解決策は簡単です。2D 不規則配列 (各行の長さが同じではない配列) を使用して、疎行列を表すことができます。
lsa - LSAで計算された文間の類似性はどのようになっていますか?
単語間の類似度を計算するときにLSAがどのように機能するかを理解しました。ウェブサイトlsa.colorado.eduのLSAを使用していますが、文または複数の単語間の類似性がどのように計算されるかについてのソースが見つかりません。それは、すべてのペアごとの類似性を平均することによって行われるだけですか?
routing - OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にある理由
OSPF LSA シーケンス番号が 0x80000001 から 0x7FFFFFFF の範囲にあるのはなぜですか。いくつかの歴史的な理由によるものだと思いますが、ググることはできません。
r - R-lsa パッケージを使用して、セマンティック スペース内のドキュメント間のコサイン類似度を計算します
R 言語を使用して同様のドキュメントをクラスター化しようとしています。最初のステップとして、ドキュメント セットの用語-ドキュメント マトリックスを計算します。次に、前に作成した用語ドキュメント マトリックスの潜在的な意味空間を作成します。用語と文書の行列だけを使用したクラスタリングの結果がひどかったため、実験で LSA を使用することにしました。作成された LSA 空間を使用して、非類似度行列 (余弦測定を使用) を作成することは可能ですか? これを行う必要があるのは、使用しているクラスタリング アルゴリズムが非類似度行列を入力として必要とするためです。
これが私のコードです:
LSA 空間から (余弦測定を使用して) 非類似度行列を構築する必要があるため、次のようにクラスター アルゴリズムを呼び出すことができます。
助言がありますか?
前もって感謝します!
installshield - InstallShield 呼び出し advapi32.dll メソッド タイプの不一致エラー
基本的な MSI InstallShield コードから Advapi32.LsaOpenPolicy() を呼び出そうとしています。他の avdapi32.dll メソッドの呼び出しに成功しました。しかし、LsaOPenPolicy はタイプの不一致エラーをスローしています。
私のプロトタイプは次のとおりです。
ウィンドウの定義は次のとおりです。
C++ サンプルで、ObjectAttriibute 構造がゼロに設定されていることに注意しました。そこで、InstallShield コードで同様の処理を行います。pArray は配列の内容を指します。
スローされた 80020005 エラー以外の情報はあまりありません。いくつかの異なる引数の構成を試しましたが、これを乗り越えることができません。
これをフレクセラとマイクロソフトのフォーラムに投稿しましたが、そこには何の関心もありませんでした。(後世の参考文献: flexera-link、microsoft-link )
どんな助けや提案も大歓迎です!
c# - Windows 環境での LSA\LSI のランダム化された SVD
私は、潜在意味解析 (LSA) の使用を含むプロジェクトに取り組んでいます。これには、特異値分解 (SVD) を使用する必要があり、大規模なデータ セットの場合もあります。Windows\Visual Studio 環境で使用できるランダム化 SVD (rSVD) の実装はありますか? redsvd というプロジェクトを見ましたが、Linux でのみサポートされているようです。
java - 確率的潜在意味分析
Java での PLSA のチュートリアルまたは実装を探しています。このリンクhttps://stackoverflow.com/questions/16396463/probabilistic-latent-semantic-analysis-indexing-in-java にも同様の質問がありますが、このクエリのうねりに対する返信はありません。Thomas Hoffman による PLSA に関する講演を見たことがありますが、実装について頭を悩ませているようには見えません。どんな助けでも大歓迎です。
python - 潜在的セマンティック分析 (LSA) のチュートリアル
このリンクで LSA のチュートリアルを使用しようとしています (編集: 2017 年 7 月。リンク切れを削除)
チュートリアルのコードは次のとおりです。
何度も読み返すが、何だか分からない。コードを実行すると、結果は次のようになります
これらのマトリックスから doc1 と doc2 の類似性をどのように把握できますか? 私が自分で書いたtfidfアルゴリズムでは、結果として単純な浮動小数点数とここに3つの行列があります。何かアドバイス?
scikit-learn - エントロピー (log-entropy) / sklearn を使用した CountVectorizer の変換
scikit-learn を使用して、潜在的意味分析 (LSA) に関するいくつかのバリエーションを試してみたいと思います。からの純粋な度数カウントCountVectorizer()
と の重み付けされた結果に加えTfidfTransformer()
て、エントロピー (および対数エントロピー) による重み付けをテストしたいと思います (元の論文で使用され、非常にうまく機能すると報告されています)。
続行する方法について何か提案はありますか? Gensim には実装 ( LogEntropyModel()
) があることは知っていますが、scikit-learn に固執することを好みます。
c++ - Windows パスワード フィルター DLL が読み込まれない
この devx 記事の例に基づいて、C++ で非常に基本的な Windows パスワード フィルターを実装しようとしています。
ただし、適切な reg エントリが設定され、DLL が system32 にコピーされて再起動されているにもかかわらず、LSA は DLL をロードしていません (msinfo32 のロードされたモジュールには何もありません)。これは 2003 x64 および 2008R2 (明らかに x64 でも) で発生します。stackoverflow を検索し、これまでのすべての推奨事項を実装しました。
私はVS2012を使用しています。x64 および /MT に設定されており (したがって、再配布の権利は必要ありませんか?)、.def ファイルが正しく参照されていることを確認しました。依存関係ウォーカーでは、「暗黙的に依存するモジュールにエクスポート関数がないため、少なくとも 1 つのモジュールに未解決のインポートがあります」と表示されますが、3 つの関数が正しくエクスポートされていることがわかります。また、kernel32.dll に一部のインポートが欠落していると主張しています (それが関連しているかどうかは不明です)。
LSA が DLL をロードするときに何が起こっているかをデバッグするにはどうすればよいですか? 注: 私は開発者ではないため、上記の一部は、特にコンパイル/リンク時および関数のエクスポート時の動作に関して、かなりあいまいです。
どうもありがとう