問題タブ [speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 音声認識サーバーをセットアップするには?
HTML5's x-webkit-speech
サーバー側で音声認識を実装する方法 ( javascript などを提案しないでください) ? プログラムはオーディオ ファイルを入力として受け取り、十分な精度でオーディオ ファイルのテキスト トランスクリプションを提供します。使用できるオプションは何ですか?
VoxforgeモデルでSphin4を実装しようとしましたが、精度が非常に悪いです(私の設定にも問題がある可能性があります.私はまだそれを学ぼうとしています). ある投稿で<input name="speech" id="speech" type="text" x-webkit-speech />
、入力を使用すると外部サーバーに送信され、そのサーバーが認識を行い、データをブラウザーに送り返すことを読みました。
そのサーバーをどのようにセットアップできますか? 最小限のエラー率で英語の文章を認識できれば、既存のオープン ソース サーバーも役に立ちます。
visual-studio - Win XP ラップトップの SAPI バージョン
Win XP Pro ラップトップを使用しています。いくつかの VB.NET プロジェクトで Speech API を使用したいと考えていました。しかし、Visual Studio で [参照の追加] ダイアログを開くと、Microsoft Speech Object Library 5.0 が表示されました。SAPI 5.1 にアップデートしてみることにしました
そこで、SpeechSDK51MSM.exe をダウンロードして、デフォルト ディレクトリ (C:\DOCUME~1\laptop\LOCALS~1\Temp) に解凍しました。(この MSM ファイルを使用する適切な方法についてはまだわかりません。)
次に、SpeechSDK51.exe をダウンロードしてインストールしました。
それでも、 Projects > Add Reference > COM に移動すると、次のようになります:
Microsoft Speech Object Library 5.0 C:\Program Files\Common Files\Microsoft Shared\Speech\sapi.dll
結果の Interop.SpeechLib.dll ファイルのバージョンは 5.0.0.0 で、5.1.xx
を期待していました
私は何か間違ったことをしていますか?
ありがとう。
google-chrome - Chrome音声入力イベントの問題
Chromeの音声入力コントロールを使用しようとしています。基本的な操作は問題ありませんが、スピーチを入力した後、イベントを発生させることができません。おそらく愚かなことですが、私には見えません。
これがhtmlです:
インラインイベントハンドラーを追加してみましたが、役に立ちませんでした。次に、jQueryバインドを試しました。
イベント名として「onspeechchange」も試してみました。私の知る限り、どちらも何もしません。
また、マイクをクリックするたびに、小さな「今すぐ話す」バブルがポップアップします。話すのをやめると、バブルの内容は消えますが、バブル自体は表示されたままで、上に表示されたままになります。Chromeを完全に閉じるまで閉じません。複数の音声入力を入力すると、複数のバブルが発生します。Chromeの設定に問題がありますか?18.0.1025.1dev-mを使用しています。
android - RecognizerIntent、Androidでのテキスト読み上げ:強制終了および許可拒否エラー
私はAndroidDeveloper'sCookbookを使用しています。私は「レシピ:音声認識を使用して結果を出すためのアクティビティを開始する」を行っています。アプリケーションを実行すると、Sorry!/ Force close toastが表示され、LogCatでこのエラーが発生します:スタックトレースファイル'/data/anr/traces.txt'を開くことができません:アクセスが拒否されました。
運がないまましばらくグーグル。当たり前のことだと思います。これが私のコードです:
android - RecognizerIntentを自動的にタイムアウトします
私はAndroidの音声認識で遊んでいますが、音声認識の意図をタイムアウトできるようにしたいと思います。Android APIのサンプルコードに基づいて音声認識インテントを作成して開始していますが、正常に機能しています。私が欲しいのは、Nミリ秒後に音声入力がない場合に音声検出を自動的にキャンセル/タイムアウトする機能です。言い換えれば、スピーチを聞いて、しばらくして何も聞こえない場合は、意図を開始したアクティビティに戻ります。これは可能ですか?RecognizerIntentのドキュメントを確認しましたが、これを行うためのインテント用の追加フィールドはありませんでした。
android - Androidで外部USBデバイスに保存されたデータを取得するには?
テキストから音声への変換のために Android でプロジェクトを行っています。外部ストレージ デバイスに保存されている音声ファイルを取得するにはどうすればよいですか??
最初に画像を試してみましたが、これが私のコードです...そして、機能していません..エラーは表示されません..しかし、何も表示されません.これは私のコードです.
.net - 音声合成装置を停止する方法は?
System.Speech.Synthesi.Syntheziserを停止するにはどうすればよいですか?一時停止と再開の方法は組み込まれていますが、エンジンを完全に停止する方法がわかりません。SpeakAsyncCancelメソッドを使用すると、stateプロパティは、シンセサイザーがまだ話していることを示していました。
スレッドを使用する必要がありますか、それとも理解できませんか?
python - python pocketphinxの単語タイムスタンプ
ubuntu 11.10でポケットフィンクスpythonバインディングを使用しています。文法と音声ファイルを渡すと、完全に機能します。現在、オーディオ ファイル内の各単語のタイムスタンプを探しています。私は見た:
私が必要とすることをするべきだと私は信じています。しかし、Pythonでこれを行う方法を見つけることができないようです。これは可能ですか?
speech-recognition - 私はScintillaを改善してJavaを音声で認識できるようにしようとしています。これがScintillaで可能かどうか誰かが知っていますか?
私はこれをよく調べましたが、何も役に立ちませんでした。また、これを行うためのAPIサポートはありますか?リンクやアイデアは大歓迎です。
animation - セリフに同期したフェイスアニメーション
ユーザーがシステムに何かを言うと、システムが声で彼に答え、声に応じて顔の表情を生成する、インタラクティブな音声対話システムを開発しています。しかし、どうすれば表情を生成できるのかわかりません。どうすれば開始できるか、またはオープンソースパッケージが既に存在する場合は、とてもいいと誰か教えてくれませんか。これに関連するオープンソースソフトウェアについて知っている人がいたら教えてください。