問題タブ [voice]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
178 参照

iphone - 人が電話をかけている間にアクティブになり、相手と「話す」ことができるiPhoneアプリを書くことは可能ですか?

たとえば、アプリは「お待ちください」などと言うことができます。または「すぐに戻ってきます」。友人から可能かと聞かれましたが、私は iPhone を持っていないので答えられませんでした。

ありがとう。

0 投票する
1 に答える
1172 参照

algorithm - Mel-Frequency Cepstrum Coefficients Algorithm でフィルターを計算するにはどうすればよいですか?

FFT と周波数を計算した後、次のようなことを行う必要があります

これらの三角形で周波数スペクトルをフィルタリングします。三角形を計算するために異なる方法を使用できることがわかりました。三角形のサイズを 1kz まで等しくし、その後は log 関数で取得します。

何をするべきだろう?周波数スペクトルと三角形が定義されている.. - 周波数をフィルタリングする必要があります (三角形に制限された周波数。より高くなると、三角形の制限までカウントされます)、各三角形の値を計算します (その後、アルゴリズムを続行します)。

しかし、メルの会話はいつ行われますか? m = 2595 log (f/700 + 1) 周波数からメルに移行するのはいつですか..

誰かが私を正しい方向に導くことができますかplz :d

0 投票する
1 に答える
4532 参照

algorithm - MFCCアルゴリズムの作り方は?

Mel-Frequency Cepstrum Algorithmを作りたいのですが、わからないことがあります。

FTT が完了したら、「三角形のオーバーラップ ウィンドウを使用して、上記で取得したスペクトルのパワーをメル スケールにマッピングする」必要があります。

私は三角形を計算する方法を知っており、メル スケールに渡す方法も知っています。私は単にそれらをどうするかわかりません。

三角形が定義されている場合、上記で取得したスペクトルのパワーをメルスケールにマッピングするにはどうすればよいですか?

このようなものですか: 三角形内の周波数を合計してから、メル スケールに渡しますか? または、重み値 (その時点での三角形の高さによって定義される) に従って三角形内の周波数を合計し、それをメル スケールに渡しますか? または、三角形内のすべての周波数を、weith 値に従ってメル スケールに渡しますか? 別物?

誰かが私にこれを明確にすることができますか

0 投票する
4 に答える
377 参照

signal-processing - 高速フーリエ変換を計算するとき..?

2 つのチャネルを持つマイクから音を取得する場合、周波数スペクトルを計算するには、次のようにします。

  • すべてのデータ入力の高速フーリエ変換を計算しますか?
  • 左右の各チャネルの高速フーリエ変換を計算し、両方の平均を作成しますか?
  • 左右の各チャネルの高速フーリエ変換を計算し、両方の最大値を取得しますか?
  • 別の方法で計算しますか?
0 投票する
2 に答える
357 参照

voice - インテリジェント音声録音:アイデアのリクエスト

会議室があり、会議が任意の即席の時間に行われるとします。すべての会議の音声記録を保持したいとします。できるだけ使いやすくするために、会議の出席者は何もする必要はありません。特定の部屋で会議を行うと、その記録があることを知っているだけです。

明らかに、ノンストップで記録するだけでは、データストレージの浪費とふるいにかけるのが面倒になるため、非効率的です。

私はそれを回避するための2つの基本的な方法があると思います。

  1. 録音は、サウンドレベルのしきい値に従って開始および停止するだけです。
  2. 記録は継続的ですが、X分のブロックに分割されます。コンテンツが含まれていないことが判明したブロックは破棄されます。

開始が遅れたり、トリガーが失敗したりしてデータが失われるリスクが少ないと感じるので、2番目の方法の方が好きです。

Pythonと、可能であればWindowsに実装したいと思います。

実装の提案?

おそらく彼ら自身の質問に値するボーナスの考慮事項:

  • この目的に最適なオーディオフォーマットと圧縮
  • 識別が非現実的であると仮定して、存在する話者の数を決定する任意の方法
0 投票する
2 に答える
4220 参照

php - PHP ベースの Web サイトでボイスチャットを実装するにはどうすればよいですか?

PHP ベースの Web サイト向けのシンプルなボイス チャット ソリューションに関する提案。すでにテキスト チャットが用意されていますが、クライアントはボイス チャットも必要としています。

0 投票する
1 に答える
820 参照

hosting - IVR開発

IVR アプリケーション (おそらく 10 回線) を構築する必要があります。私はこの分野にまったく慣れていないので、いくつかの概念に精通しています。IVR システムを構築する方法について、リンクやアドバイスを教えてもらえますか?

また、電話回線を借りる必要がある場合、正確なプロセスを知る必要がありますか? など、ホステッド IVR サービスをクライアントに提供したい場合、何が必要ですか。

どんなアドバイスも大歓迎です。

どうもありがとう

0 投票する
1 に答える
6820 参照

python - Python を使用してボイス チャット機能を実装する方法は?

私の目標は、クロスプラットフォームのボイス チャット アプリケーションです。私が少し混乱しているのは、音声転送の部分です:)

何を提案できますか?たぶん、低レベルのライブラリやフレームワークへのバインディングでしょうか?

ところで、私は Python を使用する必要はないので、Python がこの目的に適していないと思われる場合は、本当の方法を教えてください :)

0 投票する
2 に答える
789 参照

android - Android の音声対応キーボード

Android の音声対応キーボード機能のソース コードを参照してください。
コードの場所を教えてもらえますか?

0 投票する
3 に答える
4202 参照

python - Python を使用して電話をかけるには?

音声ファイルを他の電話に送信するための小さなpythonプログラムを書いています。電話はUSB経由でPCに接続されています。Python を使用して電話をかけるには?