電話で録音済みの音声と比較することができます。比較に基づいて、Good、Very Good、Excellent などの評価を行うことができます。ほとんどのクローズド サウンドが高い評価を得ます。
Androidでそれが可能であることを知っている人はいますか?
ヘルプは非常に高く評価されています。
電話で録音済みの音声と比較することができます。比較に基づいて、Good、Very Good、Excellent などの評価を行うことができます。ほとんどのクローズド サウンドが高い評価を得ます。
Androidでそれが可能であることを知っている人はいますか?
ヘルプは非常に高く評価されています。
一般的なオーディオ処理ライブラリについては、marsyasをお勧めします。残念ながら、公式ホームページは現在停止中です。
Marsyas は、サンプルの Android アプリケーションも提供しています。適切な信号分析フレームワークを取得したら、信号を分析する必要があります。たとえば、marsyas のAimC実装を使用して音声を比較できます。
コンピューターに marsyas をインストールし、Python のサンプル スクリプトをいじることをお勧めします。
音声分析には、次のようなネットワークを使用できます。
vqNetwork = ["Series/vqlizer", [
"AimPZFC/aimpzfc",
"AimHCL/aimhcl",
"AimLocalMax/aimlocalmax",
"AimSAI/aimsai",
"AimBoxes/aimBoxes",
"AimVQ/vq",
"Gain/g",
]
このネットワークは音声データを受け取り、人間の耳で処理されるように変換します。その後、ベクトル量子化を使用して、多くの可能なベクトルを 200 エントリの非常に具体的なコードブックに減らします。次に、ネットワークの出力を読み取り可能な文字 (utf8 など) に変換し、文字列編集距離 (レーベンシュタイン距離など) などを使用して比較できます。
もう 1 つの可能性は、marsyas がサポートする音声認識に MFCC (Mel Frequency Cepstral Coefficients) を使用し、たとえばDynamic Time Warpingなどを使用して出力を比較することです。このドキュメントでは、このプロセスについてかなり詳しく説明しています。