問題タブ [julius-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
678 参照

julius-speech - ジュリアス音声認識のトリガースクリプトまたは外部プログラム

私はubuntuでJuliusを使おうとしています。数時間後、ようやく動作するようになりました。

基本的に、私がする必要があるのは、特定の単語(「コンピューター」など)を認識したときにスクリプトをトリガーすることだけです。そしてそれが主な問題です。それを行うための最良の方法は何ですか?

また、ジュリアスを「静かな」モードで実行することができないようです

それでも出力する情報が多すぎます。

統計:16000Hzでオーディオをキャプチャ

統計:adin_alsa:レイテンシーを32ミリ秒に設定(チャンク= 512バイト)

エラー:adin_alsa:カードコントロールからpcm情報を取得できません

警告:adin_alsa:詳細なオーディオデバイス情報の出力をスキップします

STAT:AD-スレッドが作成されました

警告:ストリップ:サンプル0-27の値はゼロで、ストリップされています

pass1_best:DO警告:ストリップ:サンプル192-444の値がゼロで、ストリップされています

pass1_best:プレイしてください

センテンス1:プレイする

pass1_best:

センテンス1:プレイする

pass1_best:警告:ストリップ:サンプル406-436の値がゼロで、ストリップされています

等々。

助言がありますか?

0 投票する
1 に答える
244 参照

python - python pause pexpect.spawn とその使用デバイス

ホーム オートメーション プロジェクトのオーディオ入力から継続的なオーディオ データを受信するために、Python で pexpect を使用しています。オーディオ デバイスの使用から pexpect を一時停止する方法はありますか? または、オーディオ デバイスを 2 つの別々のプログラム/スクリプトで使用できますか?

私がやりたいことは: 音声認識 (julius) を使用してキーワードをリッスンします。より複雑なコマンドについては、精度が高いため、Google の Speech to Text API を使用したいと考えています。両方とも別々に完全に正常に動作します。

私の問題: キーワードが見つかったら、音声データを記録して Google API に送信する必要があります。ただし、オーディオ デバイスは 1 つしかなく、これは既に julius の音声認識で使用されています。読み込みに時間がかかるため、音声認識を .close および .spawnできません。pexpect を一時停止できる可能性はありますか? または、他の回避策を知っていますか?

ベスト、MGG

0 投票する
1 に答える
133 参照

linux - 音声認識のためのHARK

私は、HARK オープン ソース (HARK を使用する強制) を使用して音声認識アプリを設計する研究段階にありますが、HARK システムのドキュメントは私を混乱させます。

以下の HARK システム文書を読みました:

音声認識ソリューションが必要です。HARK システムは、次のような多くの機能を備えているため、私のロボット オーディション プロジェクトにとって理想的な完全なアプリ システムのようです。音声定位、機能伝達、音声認識。

私の問題は、HARK システムがどのように使用されることを意図しているのか、または HARK オープン ソースを使用/通信する方法をまだ知らないことです。

HARK システムの経験がある人に、正しい軌道に乗るのを手伝ってもらいたいと思っています。

0 投票する
1 に答える
397 参照

julius-speech - Re: Julius 音声認識

アプリケーションに Julius 音声認識を使用しています。私はジュリアスに関して 1 つの疑問を持っています。

最新バージョンをダウンロードし、そのライブラリを使用して機能させることに成功しました。私が直面している問題は..アプリが起動し、アプリケーションで音声認識機能を呼び出すと...マイクからの入力を受け取り、マイクで言われたことを表示しますが、機能はまだそうし続け、また。コントロールがその関数から出ることはありません。ここで問題に直面しています。コントロールが戻らないため、先に進むことができません。私が望むのは、エンジンがマイクから入力を取得すると、それを認識してそこで停止することです..これは、コールバック関数を削除して実行しようとしましたが、失敗しました。

希望の出力を得るために何をする必要があるか、誰でもこの問題について私を案内してもらえますか。それは私にとって役に立ちます。

0 投票する
1 に答える
104 参照

python - Juliusによる認識のために音声をキャプチャするためのadintoolまたはpsychopy?

ジュリアスと協力して音声認識を行っています。マイクが動作している限り、音声を一貫して Julius に渡し、個々の単語をライブラリに保存したいと考えています。メモリとデータの使用量が最も少ない音声が検出された場合にのみ、オーディオを録音および/または渡すための最良の方法を探しています。

adintoolは Julius 用に開発されています。次のようにコーディングします。

adintool を使用すると、サーバー モードでオーディオを Julius に渡すことができると思いますか?

PsychoPyは Python ベースであり、私は Python に精通していますが、Julius は C で記述されています。PsychoPy はサウンドを録音し、WAV ファイルとして Julius に送信します。これにより、メモリとデータ リソースに負担がかかるのではないかと思われます。

このスレッドには、音がある場合にのみ録音するための便利な提案がいくつかあります。adintool または PsychoPy の前にこれを使用することは理にかなっていますか? それとも、これらのツールにはすでにこの機能がありますか?

概要: adintool と PsychoPy の間で、どちらが julius による処理用の軽量オーディオ キャプチャに最適で、サウンドがある場合にのみ録音/キャプチャするには追加のコードが必要ですか?