問題タブ [htk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mfcc - HTK ツールとサンプリング レート
こんにちは、皆さん。(この文でいいですか?)
音声(単語)認識をHTKツールでシミュレートしてみました。
そして、*.wav ファイルがあります。
サンプリング レートが 16KHz のファイルもあれば、サンプリング レートが 44.1KHz のファイルもあります。
そして、各サンプリングレートについて mfcc ファイルを作成します。
しかし、私はすべて(16KHzと44.1KHz)のmfccファイルを使ってHMMモデルを作っています。
異なるサンプリングレートを混ぜてHMMモデルを作ってもいいですか?
提案ではなく、確実に情報を知る必要があります。
読んでくれてありがとう。
batch-file - バッチ ファイルから PuTTY で自動的に実行されるコマンド出力のレイアウトが壊れている
この質問に従って、ユーザー名とパスワードで PuTTY を実行するバッチ ファイルを作成しました: How to run a command file in PuTTY using automatic login in a command prompt?
PuTTY はcode.txt
、次のコードを含むファイルを実行しようとします。
マトリックスが表示されます。バッチ ファイルを実行しようとすると、PuTTY を開いてログインし、テキスト ファイルでコマンドを実行できます。しかし、PuTTY ターミナルの出力はめちゃくちゃです。これらのことを手動で行う場合、出力のレイアウトは問題ありません。なんらかの設定が抜けているということでしょうか。バッチファイルが別のアプリケーションの出力を変更するのは意味がありません......ありがとう
htk - HTK を使用して言語モデリングを行う方法
言語モデリングに HTKを使用する方法について混乱しています。Voxforgeサイト のチュートリアルの例に従いました
http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial
トレーニングとテストの後、約 78% の精度が得られました。私は母国語でこれを行いました。今度は、言語モデリングに HTK を使用する必要があります。
同じことを行うためのチュートリアルはありますか? 私を助けてください。
ありがとう
linux - Linux に HTK をインストールできない
話者認識に ALIZE を使用したくありません。インストール後に、SPRO または HTK を使用した機能抽出のステップがあります。HTK のzip ファイルをダウンロードし、ターミナルを使用してすべてを構成しましたが、make allを入力すると、このエラー:
それはどういう意味ですか、これを修正する方法は? 何時間も答えを探していますが、何も見つかりません...
私はHTK 3.4.1安定版とLInux ubuntu 16.10を使用しています
text-to-speech - HTS を使用して Festival の新しい音声を作成する
私は、HMM ベースのアプローチを使用してローカル言語のシンセサイザーを構築するプロジェクトに取り組んでいます。これまでのところ、HTK Book で説明されているように、強制アライメント ファイル (aligned.mlf) を生成できました。ただし、HTS を使用してシンセサイザーを構築する方法についての段階的な手順を見つけることができません。私が行ったことは、HTS Web サイトでサンプル Speaker Dependent Demo をダウンロードし、そのデータをトレーニングすることです。音声フォルダーにあるのはcmu_us_arctic_slt.htsvoice
ファイルです。したがって、私の2部構成の質問は次のとおりです。
1) このファイルを Festival の音声として使用するにはどうすればよいですか?
2)持っている強制アラインメント ファイルから、自分の声をトレーニングするために必要なファイルを生成するlabel
にはどうすればよいですか?utt
どんな助けでも大歓迎です。ありがとう。
optimization - HTK: 電話ごとに混合物分割電話を最適化する
HTK を使用して音響モデルをトレーニングします。私の最後のステップは、電話ガウスの混合物を分割することです。通常、私は常にすべての電話 (その内部状態) を 1 ステップずつ分割し、パフォーマンスが低下したときに再見積もりして停止します。
ここで、電話を 1 つずつ分割してみます。これにより、全体的な結果が同等またはそれ以上になるはずです。私が行っている方法は、すべての電話を分割し、最良の結果をもたらしたものを選択し、分割したままにして、他のすべてをリセットし、最初からやり直すことです. ただし、これには時間がかかりすぎます。最高のものだけでなく、改善をもたらしたものすべてを分割して、次の反復に進むことを考えました.
私の質問は次のとおりです。電話を分割するとパフォーマンスが低下する場合、後の段階で再度分割しようとする意味はありますか? または、それをブラックリストに載せて、最後の反復で改善をもたらしたものを試してみることはできますか?
ubuntu - ubuntuでhtsを使用してフェスティバルをコンパイル中にSIODエラーが発生しました
Ubuntu16.10 で HTS-demo_CMU-ARCTIC-SLT をコンパイルしてみました。
しかし、以下のエラーが発生しました。
フェスティバルがこれらの問題を引き起こしたと思います。これは、フェスティバルをインストールするための私のプロセスです。
この問題を解決するのを手伝ってくれませんか?
[追加]
( http://www.cstr.ed.ac.uk/downloads/festival/2.4/ )からフェスティバル バージョン 2.4 を取得します。