問題タブ [hidden-markov-models]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - pos tagger の Baum-Welch アルゴリズム
みんな。Baum-Welch アルゴリズムを使用して pos tagger をトレーニングしていますが、完全に教師なしの方法です。ここで問題が発生します。ラベルの結果を取得すると、一連の数字しか取得できません。どのラベルが VV、NN、DT を表しているのかわかりません。どうすればこの問題を解決できますか?
c++ - HTK(隠れマルコフツールキット)を使用したC /C++コード例
私はHTKを使い始めようとしています。コピーを取り、それをコンパイルし、本を手に入れました。すべてが多かれ少なかれうまくいき、あちこちで少し問題がありましたが、深刻なことは何もありませんでした。
この本を読んでしばらくグーグルした後、私にとって重要な部分であるHTKLibのドキュメントは見当たりません。すべてのHTKツールプログラム(スクリプト可能なコマンドラインインターフェイスツール)の詳細がすべて説明されていますが、実際にlibを呼び出す方法の例やチュートリアルが1つも見つかりません。
誰かが私を方向に向けることができますか?それぞれのツールのソースコードが含まれていますが、ソースコードを読んで評判の良いライブラリの情報を抽出するのはかなり面倒です...もう少しドキュメントを期待していましたが、単に見落としていたのでしょうか?
どんな助けでも深く感謝します、
トム
編集:私はHTKをNLPではなくコンピュータービジョンの目的で使用しようとしていました。そのために、HTKに対してリンクし、コード内から呼び出すことができる必要がありました。返信ありがとうございます。
python - Python を適切にサポートしている HMM (隠れマルコフ モデル) ライブラリはどれですか?
HMM (隠れマルコフ モデル) システムをトレーニングする必要があります。HTKまたはCSLU Toolkitを使用できると言われました。最初のものには、どうやらpyhtkと呼ばれる Python のバインディングがあります。
そのビンディングを使ったことのある人はいますか?あなたは私にそれを勧めますか?Python をより適切にサポートする他の HMM ライブラリはありますか?
ありがとう
theory - Kinect ジェスチャー認識理論
スケルトンの動きに基づいてユーザーのジェスチャを検出するアルゴリズムにはどのようなものがありますか? 私が知っているものは次のとおりです。
a) 隠れマルコフ モデル。HMM にフィードする手の位置、肘の角度など、HMM の多数のパラメーターを定義します。そして、ジェスチャーを十分に確実に認識できるようになるまで、システムのトレーニングとパラメーターの微調整に時間を費やします。これがWiiのジェスチャーの一般的なやり方だと思います。kinect の良い例です。
b) ドットを接続します。ジェスチャのボキャブラリーが限られている場合は、各手が通常たどるパスに沿って衝突球を設定できます。パスを十分に速くたどらないと、ジェスチャーが失敗する可能性があります。
どちらの方法でも、成功/失敗率を希望どおりにするには、おそらく多くの調整が必要になるでしょう。私が気付いていない他のアプローチがあるかどうか、またこれらのそれぞれの利点は何か疑問に思っています。
bash - プログラムからのエラーコードのチェック - 特に HTK Toolkit
やHTK
などのコンポーネントを呼び出して、テキストの電話レベルの境界を計算するbash スクリプトがあります。操作が成功したかどうかを確認するにはどうすればよいですか? 私は次のことを試しました: HCopy
HVite
./findWordBoundary.sh <input args> |& tee run.log
上記のアプローチは機能しません。HTK
ユーティリティによって出力されるすべてのものはrun.log
、Error ステートメントと条件を除いて に書き込まれます。したがって、grep
onの使用run.log
は非スターターです。
x=./findWordBoundary.sh <input args>
も機能しません。エラー状態を除いて、メッセージの負荷全体をダンプするだけです。x.
私が探しているのはこれです:操作がエラー
になったときにログを記録し、適切なアクションを実行する方法。HTK
また、これはより一般的な bash ユーティリティに拡張できると思いますwget
。スクリプト内から、bashユーティリティからログとエラーをどのように処理し、それを処理しますか(たとえば、 をwget
返すとき404:Not found exception
)?
ありがとう、
スリラム。
neural-network - 分類技法
私の BE 最終年度のプロジェクトは、手話認識に関するものです。愚かなユーザーによって生成された標識のビデオに見られるパターンの正しい分類手法を選択する際に、私はひどく混乱しています。ニューラル ネット (NN) はいくつかの点で隠れマルコフ モデルよりも優れていることを学びましたが、NN のパラメーターを微調整するには多くの時間が必要です。また、一部のレポートでは、サポート ベクター マシンが NN よりもパフォーマンスが優れているという報告があります。これらの代替案の中から何を選択すればよいか、または他のより良い代替案があれば、4 ~ 5 か月以内にプロジェクトを完了でき、修士課程でその分野を続けることができますか?
.net - .NET で使用できる HMM (隠れマルコフ モデル) 圧縮ライブラリは何ですか?
データ圧縮にマルコフモデル/隠れマルコフモデルを使用するライブラリを探しています。.NET から使用する必要があります。私は MM/HMM コンプレッサーを探しましたが、役立つリファレンスは見つかりませんでした (私は悪いグーグルかもしれません)。
関連するリンクは非常に高く評価されます。
signal-processing - ビデオ機能をアップサンプリング/補間する簡単な手法は?
オーディオとビジュアルの機能を並行して分析しようとしています。私のオーディオ音声機能は、隠れマルコフ モデル ツールキットを使用して 100fps でサンプリングされたメル周波数ケプストラム係数です。私の視覚的特徴は、私が作成したリップ トラッキング プログラムに由来し、29.97 fps でサンプリングされています。
サンプル レートも 100 fps になるように視覚的特徴を補間する必要があることはわかっていますが、これをオンラインで行う方法についての適切な説明やチュートリアルが見つかりません。私が見つけた助けのほとんどは、読者に代わって補間の知識を前提とする音声認識コミュニティからのものです。つまり、ほとんどは、単純な「サンプルレートが 100fps になるように視覚的特徴を補間する」というステップをカバーしています。
誰かが私を正しい方向に向けることができますか?
どうもありがとう
python - Rまたはpythonでの隠れマルコフモデルの実装
Python、R (Bioconductor) で HMM を実装する方法についての良い文献やチュートリアルを知っていますか? (特に配列解析用)
hidden - 次の観測を予測する隠れマルコフモデル
私は鳥の動きの500の観察のシーケンスを持っています。鳥の501番目の動きがどうなるかを予測したいと思います。私はウェブを検索しましたが、これはHMMを使用して実行できると思いますが、そのテーマについての経験はありません。この問題を解決するために使用されるアルゴリズムの手順を誰かが説明できますか?