問題タブ [sound-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - アンドロイドで音の最大振幅を数える方法は?
私はここで、パンチの最大振幅音をカウントする機能を探しています。デモ アプリで Android 音声認識 API を使用しましたが、すべての音 (ノイズ) をカウントしており、カウントは弾丸のように実行されています。パンチバッグの音に影響を与えるパンチのカウントのみを行い、パンチを逃したくない場合、このカウントは音楽、会話、くしゃみの音で変化しません。
python - 特定の周波数範囲の値を取得する方法
.wav ファイルがあり、それをロードすると、スペクトルを dB で示す次のスペクトログラムが得られます
http://i.stack.imgur.com/22TjY.png
これら4つの値が存在するかどうかを認識するために、他のwavファイルと比較したいので、これらの値を正確に知りたいと思います。
http://i.stack.imgur.com/Jun25.png
その写真を生成するソース (他のスタックオーバーフローの例から取得)
情報は Pxx にあると「思います」が、取得方法がわかりません。
pointers - 引数リスト エラー C++/CLR
音声認識プログラムを作成していますが、C++ で解決できない構文エラーがあります。
エラーは言う:
エラー 1 エラー C3867: 'SoundRecognizer::MyForm::sRecognize_SpeechRecognized': 関数呼び出しに引数リストがありません。&SoundRecognizer::MyForm::sRecognize_SpeechRecognized' を使用して、メンバへのポインタを作成します d:\c++\studio\testing\soundrecognizer\soundrecognizer\MyForm.h 114 1 SoundRecognizer
機能sRecognize_SpeechRecognized
:
ios - Swiftでの「音」認識?
私は Swift でアプリケーションに取り組んでおり、プロジェクトで非音声認識を取得する方法を考えていました。
つまり、サウンド入力を取り込んで、プロジェクトに既に組み込まれている定義済みのサウンドと照合し、一致した場合に特定のアクションを実行する方法はありますか?
上記を行う方法はありますか?音をバラバラにしてチェックしようと思っているのですが、なかなか先が見えません。
javascript - Web Speech API - 生の言葉
話されている生の文字を私に与えるために Web 音声 API を取得しようとしています。APIから私はこれを見つけました:
SpeechRecognitionAlternative: トランスクリプト属性 トランスクリプト文字列は、ユーザーが話した生の単語を表します。継続的な認識のために、連続した SpeechRecognitionResults の連結がセッションの適切なトランスクリプトを生成するように、必要に応じて先頭または末尾の空白を含める必要があります。
私はそれを使用する方法がわかりませんが。
私が必要とするのは、ユーザーが特定の音を出しているかどうかを検出することです。医者が喉をチェックするときに発するのと同じ音 - 「AHHHHHHHHH」と言う
Web 音声認識の問題点は、実際にはそうではないのに、その音を有効な単語として認識しないことです。そのため、ユーザーが音を出している間に生の文字を拾う必要があります。
これは可能ですか?
ありがとう
python - C または Python の音声認識および分類ライブラリ
...
こんにちは、みんな!
私は音声認識に関する日曜大工のデバイスを作ろうとしている学生です。音声認識ほど正確で複雑ではありません。小さなアプリに単純な認識ライブラリを採用して使用したいだけです。
私がやりたいことは、つまり「広範囲」での音声認識です。つまり、「ブーン!ブーン!」という音がする場合です。「よし、これはシボレー コルベット Z06 の特定のエンジン音だ。いいマシンだな」などと認識する必要はありません。(X) ではなく、「車が近づいてくる。うるさくてうるさい」のようなものとして認識します。(O) これで十分です。
または、「カブーン!」という音がする場合。「バン!」、「北大橋で花火大会。今年の冬は?遅れてる人もいるのかな?」と認識しなくてもいいです。(X) しかし、「ファイアー ブーム。私は決してそこに行きません。奇妙です。」(○)これで十分です。... 等々。つまり、匿名ライブラリでサウンドを「分類」し、アプリで提供されるガイドラインの有用な情報として使用したいと考えています。
役立つ情報や参照できる推奨ライブラリはありますか? 素晴らしいアドバイスをお待ちしております。ありがとうございました。
よろしく、
J・パーク