音声をテキストに変換するためのAPIを探しています。この例では、ビデオファイルにオーディオマイニングを追加します。つまり、ビデオにタグワードを自動的に生成し、ユーザーがタグワードが話されているタイムコードに直接ジャンプできるようにします。
Google Speech APIはうまく機能しているようですが、http://lists.w3.org/Archives/Public/public-xg-htmlspeech/2011Feb/att-0020/api-draft.htmlのドキュメントはそうではありません。最善であり、レコードの開始イベントと停止イベントを自動的にトリガーする方法はまだ見つかりませんでした(システムが入力が終了したと判断した後に終了します)。システムがその場合の準備ができていないように聞こえますが...
この投稿https://stackoverflow.com/questions/2080401/is-there-a-speech-to-text-api-by-googleもここで見つけましたが、Androidシステムでのみ可能であるようです。
だから基本的に私の質問は:フラッシュやPHP / JSのようなものでGoogleスピーチAPIを使用する方法はありますか(はいの場合は良い例があります)、そうでない場合は誰かがいくつかの良いドキュメントやサンプルコードで他のAPIを知っていますかビデオの音声をテキストに変換するには?
ありがとう、クリス