問題タブ [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
1434 参照

speech-recognition - 組み込みアプリケーション用の音声認識エンジン

WindowsCE音声対応アプリケーションを開発するために利用可能な音声認識エンジンとSDKを調査しようとしています。私はニュアンスに出くわしましたが、他には何も見えません。可能であれば.NetSDKを使用したいと思いますが、ほとんどはC /C++だと思います。何か提案をいただければ幸いです。ありがとう。

0 投票する
1 に答える
229 参照

speech-recognition - 認識される前に入力音声を取得する方法

認識される前に入力音声を取得する方法。たとえば、「ヘル」と言うと、辞書に見つからないか、別の単語だと思います。私はただ「ヘル」を手に入れたいだけです

0 投票する
4 に答える
2065 参照

iphone - iPhoneで音声をテキストに変換する方法は?

ユーザーがiPhoneで何かを話すと、対応するテキストに変換されるアプリケーションを構築したいと思います。

私はそれが可能であるWindowsプラットフォームで聞いた。

これがiPhoneで可能かどうか?これに利用できるAPIはありますか?

0 投票する
1 に答える
355 参照

.net - カスタム .net アプリの Speech to Text に関する考慮事項

私は、社内でのみデータ入力に使用される .Net 3.5 WinForm アプリです。ほとんどの場合、さまざまな形式のテキストボックスなどです。Windows 7 の音声認識では、アプリで「すぐに」動作するようです

私が疑問に思っているのは、それが完全に真実であるかということです。アプリで最高レベルの使いやすさを確保するには、どのような手順を踏む必要がありますか? UI 要素やその他のタグを使用していますか。

ここでSystem.Speech.Recognition Namespace話していることを含める必要がありますか

ガイダンスやアドバイスをいただければ幸いです。主に、要素に音声認識用の特定のハンドルを与える方法。

0 投票する
3 に答える
5449 参照

c# - System.Speech.Recognition 認識プロファイルの選択

.NET アプリケーション内から認識プロファイルを変更する方法を知っている人はいますか?

System.Speech.Recognition 名前空間にある機能を使用して音声認識を行う .NET アプリケーションを作成しています。システムに供給しているオーディオは、複数の異なるユーザーからのものです。さまざまなユーザーの音声をより正確に認識できるようにシステムをトレーニングできるようにしたいと考えています。

Windows (この場合は Windows 7) でトレーニング プロファイルを構成できる音声認識コントロール パネルを見つけました。自分のプロファイルを設定し、トレーニング プロセスを実行することで、認識の精度が大幅に向上しました。そのため、すべてのユーザーのプロファイルをセットアップしてトレーニング プロセスを実行させることができますが、アプリケーションで適切なプロファイルを選択できるようにする必要があります。

私のアプリケーションは、一度に 1 人以上のユーザーからオーディオ ストリームを受信し、音声認識を実行する「サーバー」です。そのため、アプリケーションが作成する認識エンジンのインスタンスごとに、どの認識プロファイルをプログラムで使用するかを指定できる必要があります。これはシングル ユーザー アプリケーションではないため、Windows コントロール パネルからプロファイルを選択させることはできません。

0 投票する
4 に答える
7073 参照

iphone - iPhoneでの音声からテキストへの変換方法

iPhone SDKを使用して音声をテキストに変換する方法はありますか?

0 投票する
2 に答える
1102 参照

speech-recognition - 小さな音声サブセットの音声からテキストへの変換を実装する最も迅速で簡単な方法

Mac OS x でマイクを介して音声を受信するシステムを実装したいと考えています。システムを訓練しない限り、任意の音声認識はほとんど不可能であることを知っているので、10 の簡単な文に制限しても構わないと思っています。これらの 10 文のうちどの文が話されているかを高い精度で認識し、テキストを生成して、リモートの MySQL データベースにエントリを追加する必要があります。

これらが私が実装したいシステムのアーキテクチャであるため、このシステムを実装するための最良の方法について概要を説明してくれる人はいますか? これはデモンストレーション用のプロトタイプ アプリケーションにすぎないため、コーディングを最小限に抑えるためのオープン ソース ライブラリのようなアイデアを探しています。基本的に、私は迅速かつ簡単な解決策を探しています。ありがとう!

0 投票する
2 に答える
1584 参照

speech-recognition - サーバー側の音声認識からテキストへ

音声認識エンジンのサーバー側をインストールしようとしています。(実験用であるため、非営利目的で使用することをお勧めします)

アイデアは、ユーザーがWebサイトから何かを言うことができるようにすることです。そうすれば、ユーザーが言ったことはすべて画面に(テキストとして)表示されます。

Microsoft Speech、Sphinx、Juliusなど、利用可能な多くのソフトウェアについて読んだことがありますが、どれが最適でインストールが最も簡単かわかりません。また、通常、この種のことを行うには、ホスティングに対するルート権限が必要ですか?現在、通常の共有ホスティングを使用しています。

ありがとう、
ティー

0 投票する
1 に答える
887 参照

speech-recognition - SpeechToText(音声認識)とその後のTextToSpeech(同じテキストと同じ音声を使用)を行うことは可能ですか?

私は音痴の人のためのプログラムに取り組んでいます。私はsapiとTTを使用しています。プログラムは同時に手で 3D アニメーションを行います。しかし、問題は、声が(最も遅いスピーチに置かれた場合も)、私が望むもののために断食することです。そこで、音声認識を考えてみたのですが、問題は、アニメーションが始まる前にテキストに大きな処理をしなければならないことです。

それで、(.wave ファイルの私の声から) 音声認識を行い、その後 TT の同じプロセスを (Sapi イベントを使用して...) 行うことが可能かどうかを知りたいのですが、私の声で .wave を使用します。

可能であれば、方法を教えてください。より良い代替案があると思われる場合は、それらを見せてください。

お時間をいただきありがとうございます(そして私の英語を許してください)

イエスキェヴィチ

0 投票する
1 に答える
751 参照

speech-recognition - SAPI: サーバー側のディクテーション

皆さん、私は Microsoft SAPI を使用して次の目的でサーバー側システムを構築しようとしています。

  • サーバーで複数の同時ディクテーション スタイルの認識を実行します。
  • さらに、すべての認識で異なるスピーカー プロファイルを使用することができます (私のアプリケーションはユーザーを識別し、どのプロファイルを読み込むかを SAPI に指示します)。
  • また、さまざまなユーザー プロファイルをプログラムでトレーニングしたいと考えています。

上記のいくつかはマネージ コード、つまり System.speech 名前空間からは不可能であることを既に知っています。SAPI 5.x を使用して、私がやろうとしていることが理論的に可能かどうかについて誰か教えてもらえますか?

ご協力いただきありがとうございます。

-ラージ