問題タブ [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Galaxy Tab の音声認識 - オフライン
Samsung Galaxt タブのオフライン モード (インターネット接続なし) で動作する音声認識サービスはありますか?
automation - 反復的なゲーム開発タスクの自動化
免責事項: これは自由回答形式で、ちょっと「遠い」質問です
ここ数年、私はいくつかの iPhone ゲームを作成してきました。Xcode
やのような非常に一般的なプログラムを使用Illustrator
してゲームを作成しています。
最近、特定のタスクを何度も繰り返すことにうんざりしています。ここではいくつかの例を示します。
- in
Xcode
: 「ターゲットをクリーンアップ、ビルド、実行」を何度も繰り返す - in
Xcode
: イメージ リソースを削除してから、更新されたイメージ リソース (同じ名前) をインポートします。
でこれらのタスクを自動化したいと考えていXcode
ます。何か案は?マクロを記録する「ボタンモード」を使用して、Photoshop でいくつかの自動化を行いました...これは非常に便利です。
質問のちょっと風変わりな、または「遠い」部分は次のとおりです。音声コマンドを介してこの自動化をどのように行うことができますか? (ニュアンス製品か何かを使っているのかもしれません)
いくつかの音声コマンドでやりたいことの例を次に示します。
- イラストレーターからのアートワークをユーザー指定のサイズで保存 (@2x バージョンも)
- から"
someArt.png
" と " " を削除しますsomeArt@2x.png
Xcode
- の更新されたバージョンをに追加し
someArt.png
ますXcode
- In
Xcode
: クリーン ターゲット、ビルド、および実行
この質問はおそらく奇妙に思えるかもしれません... しかし、このようなものは、ゲーム開発者にとって特定のことを大幅に簡単にする可能性があります.
AppleScript
と Nuanceの組み合わせが機能するかどうか疑問に思いますか?
android - Android または音声タグ (音声コマンド) API での音声 wav の比較
私はアプリを開発しています.2つの声が一致するかどうかを比較する方法が必要です.Voice Recognizerがそれを行う方法であることは知っていますが、最初に声を文字列に変換する必要があるため.音声認識エンジンでサポートされている言語以外の言語にはあまり適していません....何か考えはありますか? 昔の電話と同じように、音声入力をセットアップ中に以前に録音した音声と比較するだけの音声タグ
android - 音声認識API、Google Voiceはこれを行いますか?
私はAndroidアプリのアイデアを思いついたので、コマンドを発声して、アプリケーションにこれらをリッスンさせ、何らかのアクションを実行させたいと思っています。
たとえば、アプリをアイドル状態にして自分の声を聞いてもらいたいのですが、「開始」と言うのを聞くと、「停止」と言うまでアプリは何かを開始します。
アイデアは、電話を横に置き、アプリを制御するために物理的に触れる必要がないようにすることです。
これは現在のAPIで可能でしょうか?もしそうなら、私はどれを調べるべきですか?
windows-phone-7 - 私のアプリケーションで音声認識モジュールを使用することは可能ですか?
@Matthieuのブログhttp://wp7wonders.wordpress.com/で昨日写真を見ました(申し訳ありませんが、今は見つかりません。この写真には、電話の検索ページと同じように、マイクアイコン内にテキストボックスがあります。
私の質問は、この機能をアプリケーションで使用できますか?
ありがとう。
java - 音声認識、おそらく正規表現を介して、ユーザーの発言を特定する方法はありますか?
Android の音声認識機能を使用しています。デバイスに話しかけると、可能な単語のリストが表示されます。
「開始」と言うと、聞いたと思った次の単語が表示されます。
- 株式
- 株式
- 止まる
- 始める
- 止まる
- スタークス
そのリストは、他のさまざまな要因の中でユーザーのアクセントに依存します。そのリストで特定の単語を確認する簡単な方法はありますか?
ユーザーがコマンド「start」または「stop」を発行した場合、2 つのコマンドの違いを認識できる必要があります。
私の最初の考えは、正規表現を使用して、応答のいずれかで「sta」または「sto」をチェックすることでした。より効果的な方法はありますか?
android - バックグラウンドで実行する Android 音声認識アクティビティを非表示にしますか?
どちらかへの方法はありますか
A) GUI を開かずにアクティビティを開始する B) 現在のアクティビティの背後で VoiceRecognitionActivity を開始するので、ユーザーは気付かないのですか?
本質的に、私は音声認識がどのように UX を混乱させるかが好きではなく、ユーザーが自分のアクティビティで「聞いている」という言葉だけを見たいと思っています。Android は素晴らしい OS であり、もっと美しいアプリが必要だと思います!
私は Android の初心者です (私の質問履歴からわかるように)、あなたの助けにとても感謝しています。
iphone - ShareKit プログラムで [公開] をクリックします。
編集:元の質問で、これをTwitterで機能させることができたと述べたことに注意してください(参照された質問/回答を使用して機能させました)。. . Facebookでそれを行う方法についての答えが必要でした. Facebookでこれを行う同等の方法は見つかりませんでした。
ShareKit を使用して、ユーザーがアプリのデータを Facebook や Twitter と共有できるようにしています。
Facebook の共有で特定の問題が発生しています。
私のアプリはほぼ完全に音声で制御されるため、音声コマンドで次のように呼び出します。
ユーザーが投稿を編集してキャンセルまたは公開できるダイアログ(UIWebViewだと思います)が表示されることを除いて、これはうまく機能します。
アプリは音声で制御されるため、この手順をスキップして、基本的にプログラムで「公開」をクリックします (プログラムで公開メソッドを呼び出します)。そのダイアログが一時的に表示されてから消えてもかまいません (これが私が Twitter を処理する方法です。Twitter でこれを行う方法を理解することができました)。ただし、この公開メソッドを見つけることができません。これは、FBConnect によって処理されるサーバー側の呼び出しであるためだと思います。
a)これを行うために使用するコード、およびb)そのコードを配置する場所に関するアイデアはありますか)?
よろしくお願いします。
ベン
android - Android Instant Speech to Text 音声認識
Android の経験はあまりありませんが、聴覚障害のある友人から、モバイル デバイスで基本的に音声をテキストに「ストリーミング」する方法があるかどうか尋ねられました。私はandroidの組み込みAPIを使用して調べましたが、音声入力が完了した後に処理のために音声を送信するだけのようです。連続して動作するものを探しています (Dragon が Microsoft Word で動作するのと同様)。
おそらく、これを行うアプリがすでに存在します。そうでない場合、現在の Android OS/API でこれを実装する方法はありますか?
任意の提案をいただければ幸いです。
android - 音声認識を無効にする方法
で音声認識をブロックする方法はありますedittext
か? softkeyboard
音声認識を使用せずに、テキストのみを取得したいだけです。
を使用してマイクをミュートしようとしましたAudioManager.setMicrophoneMute()
が、うまくいきませんでした。これを達成するために何ができますか?