1

音声をテキストに変換するためのAPIを探しています。この例では、ビデオファイルにオーディオマイニングを追加します。つまり、ビデオにタグワードを自動的に生成し、ユーザーがタグワードが話されているタイムコードに直接ジャンプできるようにします。

Google Speech APIはうまく機能しているようですが、http://lists.w3.org/Archives/Public/public-xg-htmlspeech/2011Feb/att-0020/api-draft.htmlのドキュメントはそうではありません。最善であり、レコードの開始イベントと停止イベントを自動的にトリガーする方法はまだ見つかりませんでした(システムが入力が終了したと判断した後に終了します)。システムがその場合の準備ができていないように聞こえますが...

この投稿https://stackoverflow.com/questions/2080401/is-there-a-speech-to-text-api-by-googleもここで見つけましたが、Androidシステムでのみ可能であるようです。

だから基本的に私の質問は:フラッシュやPHP / JSのようなものでGoogleスピーチAPIを使用する方法はありますか(はいの場合は良い例があります)、そうでない場合は誰かがいくつかの良いドキュメントやサンプルコードで他のAPIを知っていますかビデオの音声をテキストに変換するには?

ありがとう、クリス

4

1 に答える 1

1

自分自身への回答:無料の音声認識エンジンとして、WebアプリケーションでGoogleSpeechAPIを使用する方法はまだないようです。現在、グーグルはそれを彼ら自身の使用のために使用しています。彼らがすぐにそれを変えることを願っています;)

まだMicrosoftSpeechAPI(SAPI)を使用しています。最良の結果ではありませんが、大丈夫です。

于 2011-10-21T13:00:53.907 に答える