4

こんにちは、ユーザーが話した音声を認識してテキスト形式にする音声認識 API または SDK が必要です。

詳細な説明は次のとおりです。

私のアプリケーションでは、オーディオ ファイルとそのテキストを再生する必要があります。音声の再生が始まると、(音声ファイルから) 話されている単語が強調表示されます。

したがって、api または sdk から単語を取得できれば、それを強調表示できます。

それとは別に、私はAPIについて多くのグーグル検索を行い、 ceedvocalsdkに出くわしましたが、無料試用版は利用できません.

誰かが私の要件または api または sdk にこれ以外のアイデアを提供できる場合、私は非常に感謝します。

4

3 に答える 3

7

あなたが試すことができます

http://www.politepix.com/openears/

速度に関しては、速いはずですが、適切に使用していない可能性があります。私が理解しているように、あなたはすでにテキストを持っており、このテキストから文法を構築する必要があります。

于 2010-11-11T08:40:45.803 に答える
2

https://github.com/KingOfBrian/VocalKitを見ることができますが、私は自分で試したことはありません。

于 2010-11-11T07:03:01.090 に答える
-2

Nexiwave.com を試すこともできます。

あなたが探している機能は、タイムスタンプできるものだと思います: http://nexiwave.com/index.php/applications/for-transcription-companies

基本的に音声とテキストを取り、各文と単語にタイムスタンプを付けます。

ベン

于 2010-11-12T02:19:54.890 に答える