3

Google は最近、Chromium Web Speechや Android Handsfree texting などのいくつかのオープン ソース製品で使用されている音声認識ソフトウェアで大きな進歩を遂げました。サーバースタックの一部として彼らの音声認識を使用したいのですが、それについてはあまり見つけられません。

テキスト認識ソフトウェアはライブラリまたはパッケージとして入手できますか? または、別のプログラムから chromium を呼び出して、音声ファイルをテキストに転記することはできますか?

4

2 に答える 2

1

Web Speech API は、Chrome または Android のコンテキストでのみ使用するように設計されています。クライアントでは多くの作業が行われるため、オーディオ ファイルを取得して処理するだけのパブリックなサーバー間 API はありません。

github を検索すると、https: //gist.github.com/alotaiba/1730160 などのツールが見つかりますが、このアクセス方法は 100% サポートされておらず、承認されておらず、機能し続けることが確認されていないことは確かです。

于 2013-05-29T15:17:03.893 に答える