“htk”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

194 参照

mfcc - HTK ツールとサンプリングレート

こんにちは、皆さん。~~（この文でいいですか？）~~

音声(単語)認識をHTKツールでシミュレートしてみました。
そして、*.wav ファイルがあります。
サンプリングレートが 16KHz のファイルもあれば、サンプリングレートが 44.1KHz のファイルもあります。

そして、各サンプリングレートについて mfcc ファイルを作成します。
しかし、私はすべて(16KHzと44.1KHz)のmfccファイルを使ってHMMモデルを作っています。

異なるサンプリングレートを混ぜてHMMモデルを作ってもいいですか？

提案ではなく、確実に情報を知る必要があります。

読んでくれてありがとう。

mfcc htk

2016-06-02T03:18:53.153

0 投票する

1 に答える

203 参照

batch-file - バッチファイルから PuTTY で自動的に実行されるコマンド出力のレイアウトが壊れている

この質問に従って、ユーザー名とパスワードで PuTTY を実行するバッチファイルを作成しました: How to run a command file in PuTTY using automatic login in a command prompt?

PuTTY はcode.txt、次のコードを含むファイルを実行しようとします。

マトリックスが表示されます。バッチファイルを実行しようとすると、PuTTY を開いてログインし、テキストファイルでコマンドを実行できます。しかし、PuTTY ターミナルの出力はめちゃくちゃです。これらのことを手動で行う場合、出力のレイアウトは問題ありません。なんらかの設定が抜けているということでしょうか。バッチファイルが別のアプリケーションの出力を変更するのは意味がありません......ありがとう

2016-10-19T13:46:10.100

0 投票する

1 に答える

525 参照

htk - HTK を使用して言語モデリングを行う方法

言語モデリングに HTKを使用する方法について混乱しています。Voxforgeサイトのチュートリアルの例に従いました

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

トレーニングとテストの後、約 78% の精度が得られました。私は母国語でこれを行いました。今度は、言語モデリングに HTK を使用する必要があります。

同じことを行うためのチュートリアルはありますか? 私を助けてください。

ありがとう

htk

2016-10-27T09:48:28.283

0 投票する

1 に答える

1213 参照

linux - Linux に HTK をインストールできない

話者認識に ALIZE を使用したくありません。インストール後に、SPRO または HTK を使用した機能抽出のステップがあります。HTK のzip ファイルをダウンロードし、ターミナルを使用してすべてを構成しましたが、make allを入力すると、このエラー:

それはどういう意味ですか、これを修正する方法は? 何時間も答えを探していますが、何も見つかりません...

私はHTK 3.4.1安定版とLInux ubuntu 16.10を使用しています

linux htk

2016-11-06T15:28:31.180

0 投票する

2 に答える

1020 参照

text-to-speech - HTS を使用して Festival の新しい音声を作成する

私は、HMM ベースのアプローチを使用してローカル言語のシンセサイザーを構築するプロジェクトに取り組んでいます。これまでのところ、HTK Book で説明されているように、強制アライメントファイル (aligned.mlf) を生成できました。ただし、HTS を使用してシンセサイザーを構築する方法についての段階的な手順を見つけることができません。私が行ったことは、HTS Web サイトでサンプル Speaker Dependent Demo をダウンロードし、そのデータをトレーニングすることです。音声フォルダーにあるのはcmu_us_arctic_slt.htsvoiceファイルです。したがって、私の2部構成の質問は次のとおりです。

1) このファイルを Festival の音声として使用するにはどうすればよいですか?

2)持っている強制アラインメントファイルから、自分の声をトレーニングするために必要なファイルを生成するlabelにはどうすればよいですか?utt

どんな助けでも大歓迎です。ありがとう。

text-to-speech htk

2016-11-29T15:05:59.540

0 投票する

1 に答える

64 参照

optimization - HTK: 電話ごとに混合物分割電話を最適化する

HTK を使用して音響モデルをトレーニングします。私の最後のステップは、電話ガウスの混合物を分割することです。通常、私は常にすべての電話 (その内部状態) を 1 ステップずつ分割し、パフォーマンスが低下したときに再見積もりして停止します。

ここで、電話を 1 つずつ分割してみます。これにより、全体的な結果が同等またはそれ以上になるはずです。私が行っている方法は、すべての電話を分割し、最良の結果をもたらしたものを選択し、分割したままにして、他のすべてをリセットし、最初からやり直すことです. ただし、これには時間がかかりすぎます。最高のものだけでなく、改善をもたらしたものすべてを分割して、次の反復に進むことを考えました.

私の質問は次のとおりです。電話を分割するとパフォーマンスが低下する場合、後の段階で再度分割しようとする意味はありますか? または、それをブラックリストに載せて、最後の反復で改善をもたらしたものを試してみることはできますか?

optimization speech-recognition gaussian htk

2016-12-06T21:15:08.477

0 投票する

2 に答える

845 参照

ubuntu - ubuntuでhtsを使用してフェスティバルをコンパイル中にSIODエラーが発生しました

Ubuntu16.10 で HTS-demo_CMU-ARCTIC-SLT をコンパイルしてみました。

しかし、以下のエラーが発生しました。

フェスティバルがこれらの問題を引き起こしたと思います。これは、フェスティバルをインストールするための私のプロセスです。

この問題を解決するのを手伝ってくれませんか?

[追加]

( http://www.cstr.ed.ac.uk/downloads/festival/2.4/ )からフェスティバルバージョン 2.4 を取得します。

ubuntu text-to-speech htk festival

2017-05-30T11:13:32.267

問題タブ [htk]

Reference