1

Google音声検索は、生の音声(もちろんデジタル化されたもの)をGoogleのサーバーに送信することで機能し、Googleは結果をテキスト形式で返します。

結果自体は比較的小さいので(非常に長い文でない限り...)、インターネット経由で送信するのにかかる時間はごくわずかだと思います(HTTPオーバーヘッド、サーバー負荷などを除く)。

私が知りたいのは、このコンポーネントのインターネット接続速度への依存性(アップリンク)の概観を得るために、Googleの音声サーバーに送信される実際の「アナログ」生オーディオのサイズ(KB)です。

もちろん、その生のオーディオパケットのサイズは、話されているフレーズ(1語?全文?非常に長い文?)に大きく依存するため、これに関する統計情報(平均、標準など)を探しています。

また、これらの生のオーディオパケットが圧縮されていることも知っています。圧縮方法に関する情報はありますか?(MP3ではありませんか?)

AndroidデバイスとPC(つまりChromeベース)の間で圧縮は異なりますか?

これは直接的なプログラミングの質問ではないように思われるかもしれませんが、私の場合、答えはGoogle Voice Searchに基づくアプリケーションを構築するときに使用されるアルゴリズムに影響を与える可能性があるため、プログラミングに直接関係しています。

4

1 に答える 1

2

実際にGoogleサーバーに送信されるデータの量は測定していませんが、音声検索を合理的に想定しましょう。

  • モノを記録
  • 16kHzのサンプルレートで記録
  • 16ビット解像度のレコード
  • ロスレス圧縮を適用して、2分の1のサイズを実現

この場合、1秒の録音はを消費し(1 * 16,000 * 2) / 2 = 16,000 bytesます。

于 2012-07-11T19:46:14.093 に答える