17

電話で録音済みの音声と比較することができます。比較に基づいて、Good、Very Good、Excellent などの評価を行うことができます。ほとんどのクローズド サウンドが高い評価を得ます。

Androidでそれが可能であることを知っている人はいますか?

ヘルプは非常に高く評価されています。

4

2 に答える 2

3

一般的なオーディオ処理ライブラリについては、marsyasをお勧めします。残念ながら、公式ホームページは現在停止中です。

Marsyas は、サンプルの Android アプリケーションも提供しています。適切な信号分析フレームワークを取得したら、信号を分析する必要があります。たとえば、marsyas のAimC実装を使用して音声を比較できます。

コンピューターに marsyas をインストールし、Python のサンプル スクリプトをいじることをお勧めします。

音声分析には、次のようなネットワークを使用できます。

vqNetwork = ["Series/vqlizer", [
        "AimPZFC/aimpzfc",
        "AimHCL/aimhcl",
        "AimLocalMax/aimlocalmax",
        "AimSAI/aimsai",
        "AimBoxes/aimBoxes",
        "AimVQ/vq",
        "Gain/g",
    ]

このネットワークは音声データを受け取り、人間の耳で処理されるように変換します。その後、ベクトル量子化を使用して、多くの可能なベクトルを 200 エントリの非常に具体的なコードブックに減らします。次に、ネットワークの出力を読み取り可能な文字 (utf8 など) に変換し、文字列編集距離 (レーベンシュタイン距離など) などを使用して比較できます。

もう 1 つの可能性は、marsyas がサポートする音声認識に MFCC (Mel Frequency Cepstral Coefficients) を使用し、たとえばDynamic Time Warpingなどを使用して出力を比較することです。このドキュメントでは、このプロセスについてかなり詳しく説明しています。

于 2013-01-08T23:49:04.597 に答える