問題タブ [voice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
visual-studio-2008 - Visual Studio の音声コマンド
映画でアイアンマンがIDEの音声コマンドをどのように使用していたか知っていますか? そのようなことを行うことができる Visual Studio プラグインはありますか? そうでない場合は、どのように自分で作成しますか?
jquery - jQueryでユーザーの声を録音するには?
音声をsoundn.wavとして保存します
iphone - iPhone/Objective-C - 音声を「ライブ」に変換
だから私は少しの調査を行っています/私が行うかもしれないプロジェクトについて考えています.あなたが私に答えるのを助けることができるかもしれないいくつかの質問に出くわしました.
iPhone アプリ (objective-c) でマイク入力ライブにエフェクトを適用することは可能ですか。スニペットを記録し、これにさまざまな変換/効果音を適用できるアプリストアでかなりの数のアプリケーションを見てきました。しかし、録音部分なしでこれを行うことは可能ですか?
コメントやポインタをいただければ幸いです。
ありがとう!
ロジャー
.net - .NETでの音声認識
.NETで音声認識を実装するにはどうすればよいですか?
私は.mp3
比較的高品質のコンピューター生成音声を備えたたくさんのを持っています。それぞれ.mp3
の声で、いくつかのランダムなテキストと、英語で6〜7桁のシーケンスを言います。それらの数字をテキストとして抽出したいと思います。
そのようなことを.NETに実装することは可能ですか?
voip - Tropoに似たサービスを知っている人はいますか?
私はトロポを使用しており、サービスにかなり満足していますhttp://tropo.com/
信頼できる代替手段を知っている人はいますか?
java - java:ボイスチャットとテキストチャット
Javaで作ったカードゲームを作りたいです。人々は自分のPCでそれを実行することができます。友達を連絡先リストに追加できます。オンラインに4人のプレーヤーがいる場合は、ゲームをホストしているプレーヤーの1人がゲームを開始できます。プレーヤーはテキストまたはボイスチャットで通信できます。ユーザーがカードゲームをプレイし、4人のプレーヤー間で同時にボイスチャットできるチャットクライアントのように考えてください。
上記のプロジェクトをどのように実行するのかわかりませんが、上記のアプリを開発するために使用できるフレームワークやその他のことを誰かに提案してもらえますか?それはp2pアプリケーションのようになりますか?
c - .mp3ファイルがあります。Cの残りの音から人間の声を分離するにはどうすればよいですか?
Cでも可能ですか[一般的に可能だと思います-GOMプレーヤーがそれを行います]?始めさせてください...あなたは何と言いますか?
他の音と区別される人間の声をどの程度正確に識別しますか?
c# - 基本周波数+C#での音声検出
マイクからの音声入力をリアルタイムで検出しようとしています。
私はすでに入力を受け取り、FFTアルゴリズムを実行し、結果をdBで示しています。周波数領域、時間領域、スペクトログラムがあります。
基本周波数を取得するにはどうすればよいですか?基本周波数を取得した場合、周波数が特定の値の間にある場合、私たちが話しているのは音声であると指定できますか?私がすでに持っているものでこれを行う他の方法はありますか?
事前にTks
algorithm - メル周波数ケプストラム係数はどのように機能しますか?
私はすでにマイクの入力からリアルタイムで計算されたFFTとピッチ+絶対周波数を持っています。次に、音色を計算します。
Mel Frequency Cepstrum Coefficients - MFCCs を見ましたが、よくわかりませんでした。誰かがこれに関するヒントを教えてもらえますか..
algorithm - メル周波数ケプストラム係数アルゴリズム
オーディオの音色を取得したい。
これを使用するために、Mel FrequencyCepstrumCoefficientsアルゴリズムを作成します。
実装は単純に見えます(私はすでにステップ1を作成しました):1。信号(のウィンドウ化された抜粋)のフーリエ変換を行います。2.三角形の重なり合うウィンドウを使用して、上記で取得したスペクトルのパワーをメル尺度にマッピングします。3.各メル周波数でのパワーのログを取ります。4.信号であるかのように、メルログパワーのリストの離散コサイン変換を行います。5. MFCCは、結果のスペクトルの振幅です。
ステップ2では、周波数からメル尺度に渡す方法を知っていますが、その三角形の重なり合うウィンドウが何を意味するのかわかりません。
この手順を正しく行うにはどうすればよいですか?三角形の重なり合うウィンドウはどういう意味ですか?