問題タブ [speech-to-text]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
362 参照

android - スピーチからテキストへの変換はデバイス上で行われますか?

(私は開発用のAndroidフォンを持っておらず、現在エミュレーターのみで作業しています。エミュレーターには音声入力方法がないため、これらのばかげた質問が頭に浮かびました。)

Android はデバイス自体で音声入力を処理しますか (300 ~ 500 MHz または 1 GHz の制限されたコンピューティング能力を使用)、それとも Google サーバーに送信してテキストを取得しますか?

  • オフラインでも機能しますか?
  • 途切れることなく、一度にどれくらいの音声入力を処理できますか?
0 投票する
2 に答える
1582 参照

iphone - iPhone用の音声テキストAPI?

誰かがサンプル統合を提供できますか、またはiphoneでの音声からテキストへの変換用のサードパーティAPIを教えてください。

ありがとう&よろしく、タリク

0 投票する
2 に答える
4549 参照

android - Androidでの音声からテキストへの変換

音声からテキストへの変換に基づくアプリを開発したいのですが、提案とこのアプリの開発方法を教えてください。

0 投票する
1 に答える
348 参照

android - 図書館のスピーチが見つかりません...どうすればよいですか?

0 投票する
1 に答える
766 参照

iphone - CMUSphinxを使用したiPhone用の音声ライブラリであるOpenEarsの精度を上げる必要がありますか?

こんにちは、CMUSphinxを使用したiPhone用のこのOpenEars音声ライブラリを使用したことがあり、iOSの音声からテキストへの変換にどれだけ役立つか、80%の音声をテキストに変換するために必要な精度を教えてください。ライブラリは私のためにこれを行うことができます

助けが必要

よろしくお願いします。

0 投票する
1 に答える
5873 参照

windows-7 - SAPIとWindows7の問題

Windows 7で音声を認識しようとしていますが、常に音声をコマンドとして認識するか、「それは何でしたか?」とだけ表示されます。

どうすればすべてのスピーチを取得できますか?

コード:

0 投票する
4 に答える
28714 参照

speech-recognition - Javaで音声をテキストに変換する方法は?

Javaで音声をテキストに変換するために使用されるコードスニペットを誰かが共有できますか?

0 投票する
3 に答える
2621 参照

windows - 音声をテキストに変換するにはどうすればよいですか?

タイピングの手間をかけずに、音声をテキストに直接変換するにはどうすればよいでしょうか?

0 投票する
1 に答える
153 参照

speech-recognition - 音声入力を文字列として取得する

ユーザーが VoiceXML アプリケーションで言ったことの文字列表現を取得することは可能ですか? たとえば、データベース クエリで使用します。

これまでに見たほとんどの例は、(xml で) 定義された数の選択肢と照合しようとするだけです。これは、入力を使用して、たとえば 100k エントリを超えるデータベースと照合する場合には適していません。

ありがとう

0 投票する
2 に答える
1966 参照

iphone - iPhoneでWebアプリからネイティブアプリを起動するには?

Web アプリから iOS の TTS (Text-To-Speech) および STT (Speech-To-Text) 機能にアクセスしたい。Web アプリは iOS デバイスの機能にアクセスしないため、Web アプリからネイティブ アプリを起動することはできますか? たとえば、ユーザーが TTS (例: Dragon Dictation) にアクセスしたい場合、Web ページはネイティブ アプリを起動し、録音を行い、録音したテキストを Web アプリに再度送信します。

または、Web アプリから直接 TTS/STT 機能にアクセスできますか?