問題タブ [dictation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
3199 参照

ios - UITextField ディクテーション開始

ユーザーがキーボードからディクテーションを起動して選択する必要なく、プログラムで UITextField 入力をディクテーション モードにしたいと考えています。API ドキュメントを検索しましたが、解決策が見つかりません。何か案は?

0 投票する
1 に答える
215 参照

click - ドラゴンディクテーションマウスクリック

私は、Dragon Dictation という音声テキスト変換プログラムを使用しています。マウスクリックに使用できますが、「マウスクリック」または「マウストリプルクリック」という言葉を言わなければならず、しばらくすると非常に煩わしくなります。クリックまたはトリプルとだけ言いたいと思います。

このプログラムでは、AppleScript コードでコマンドをカスタマイズできますが、マウス クリックの方法がわかりません。

0 投票する
1 に答える
347 参照

android - Android/Google 音声認識ソフトウェアを別のプラットフォームで使用できますか?

私は最近 Android フォンを手に入れました...素晴らしいものです。OSの根性とプログラミング方法を調べ始めました。

ディクテーション用の音声認識も優れています... これがオープンソース OS であることを考えると、Android-Google 音声認識を利用する方法はありますか? 私の現在の理解では、音声トレースを Google サーバーに送信して処理する必要があります。つまり、ソフトウェアはマシン上にありません。しかし、私は間違っているかもしれません!

いずれにせよ、自分のアプリ (Android やフルサイズのコンピューターの別の OS など) でそのような利用が可能かどうか、誰にもわかりませんか?

0 投票する
1 に答える
864 参照

core-audio - Mavericks でディクテーションがアクティブなときにオーディオを再生する

Apple は Mavericks で「Enhanced Dictation」を導入しました。これは、音声をローカルでオフライン モードでテキストに書き起こす機能です。残念ながら、彼らは別の機能も導入しました - ディクテーションがアクティブな間、すべてのサウンドがミュートされます. 少し調べてみると、「ミュートされた」サウンドがまだ再生されていることがわかりました。たとえば、Audio Hijack は再生されるべきサウンドをキャプチャし、ファイルに保存します。ディクテーション中にサウンド出力を必要とするアプリケーションを作成しています (ユーザーがヘッドフォンを着用していると想定しています)。音量設定を変更しているようには見えません。ヘッドフォン デバイスでマスター ボリューム レベルを照会すると、ディクテーションの前と最中で同じであることがわかります。メニューバーの音量インジケータも変化しません。システムの残りの部分に関する限り、サウンドは再生されています。

私は CoreAudio 初心者です。録音と再生の基本的なことはできますが、それ以上のことはできません。「ミュート」されたサウンドを元に戻すことはできますか? ディクテーションがアクティブな状態でアプリケーションからのサウンドをヘッドフォンに到達させるスイッチ、フラグ、CoreAudio の機能はありますか?

0 投票する
0 に答える
149 参照

jquery - Apple ディクテーション / 音声からテキストへの jQuery イベント リスナー

Apple ディクテーション用の jQuery リスナーはありますか? ユーザーがテキストボックスで Apple ディクテーションを使用したときにアラートを受け取る方法は? 別の音声テキスト変換アプリを試すことはできませんでしたが、問題と解決策はすべて同じだと思います。

私の問題: 検索ボックスで Google Maps API を使用して都市を探しています。すべてが完璧に機能しますが、話すことによってテキストを入力すると、提案が行われないため、ユーザーは都市を探すことができません. 最良の解決策は、誰かが音声テキスト変換アプリでテキストを入力したときを確認してから、通常のようにすることだと思います。

#addressテキストボックスです

0 投票する
1 に答える
1873 参照

macos - Speech API で Mac OSX ディクテーションを使用する

OSX Mavericks には、音声ディクテーションが含まれるようになり、非常に便利です。ディクテーション機能を使用して独自のデジタル ライフ アシスタントを作成しようとしていますが、認識機能を使用して、テキスト ボックスではなくアプリケーションで音声を取得する方法が見つかりません。

私は NSSpeechRecognizer を調べましたが、それは口述ではなく、事前定義された文法を使用して話すことができるコマンドをプログラミングすることを目的としているようです。使用するプログラミング言語は何でも構いませんが、Python か Java がいいでしょう...

ご協力いただきありがとうございます!

0 投票する
0 に答える
206 参照

grammar - Microsoft 音声認識 - 数字 + ナビゲーション

私は主に文法 XML ファイルを介して C&C を使用するデータ入力プログラムを作成していますが、場合によってはディクテーションが必要になります。C&C モードでは、値のリストに加えて、ナビゲーション コマンド (GO UP、GO DOWN など) も含め、認識後に正しいアクションを実行します。すべてが良いです。

しかし、ディクテーション モードでは、これらの「コマンド」の認識はあまり成功しません (単語のリストに制限がないため)。

質問:

  1. 数字を入力したいので、ディクテーションを使用する必要があります。単語のリストを数字だけに制限する C&C 文法ファイルを作成する方法はありますか?
  2. そのような解決策がある場合でも、ナビゲーション ワード/コマンドを含める必要があります。
  3. そのような解決策がない場合、エンジンが聞く特定の「単語」により高い確率をディクテーションに割り当てる方法はありますか?
0 投票する
1 に答える
3086 参照

python - Python 内で Mac のディクテーションを使用する

Mac の組み込みディクテーション ツールを使用して、Python で使用する文字列を作成する方法について、何か考えがある人はいますか?

ディクテーションを開始するには、テキスト エディター内で Fn キーを 2 回押す必要があります。この場合、キーストローク コマンドと入力コマンドを組み合わせる方法はありますか? 何かのようなもの:

ステップ 1: キーストロークをシミュレートして Fn キーを 2 回押し、ディクテーション ツールを起動します。次に、ステップ 2. 入力関数の一部として音声テキスト変換コンテンツを使用して変数を作成します。つまり、text_string = input(“Start口述:「)

このスレッド ( GUI なしで OS X 10.8 の音声認識/ディクテーションを使用できますか? ) で、ユーザーは CGEventCreateKeyboardEvent(src, 0x3F, true) でそれを理解したと示唆していますが、コードはありません。

何か案は?コードサンプルをいただければ幸いです。

更新: 以下の提案のおかげで、AppScript をインポートしました。私はこれらの行に沿ってコードを動作させようとしていますが、成功しません:

文字列の入力としてディクテーション ツールをオンにする方法についてのアイデアはありますか?

更新 2:

作成しようとしているプログラムの簡単な例を次に示します。

キーボードで入力することなく、コマンドをプログラムに渡そうとしています。