4

私はTwilioを使用して探しています

  1. 電話を受ける
  2. 声を書き起こす
  3. 文字起こしされた録音を使用してユーザーにテキスト メッセージで返信する

うまくセットアップできましたが、Twilio での文字起こしは奇妙に低品質です。私のヨークシャー訛りを理解できないのかもしれませんが(結局のところ、カリフォルニアの会社です)、他の人から、おそらくより明確な話し声で、本当にひどいという苦情があります.

彼ら自身の文字起こしサービスを交換して、サードパーティを使用できるという考えがあります. 生成されたmp3ファイルを取得できると思います。だから私が必要なのは

  1. Web サービスなどを介して呼び出し可能なサードパーティの文字起こしサービス
  2. 完了すると、サービスはコールバックを生成します
  3. サービスは mp3 ファイルを消費します
  4. サービスは実際に合理的に転記します。テキストは修正のためにユーザーに返されるため、完璧である必要はありませんが、かなり良いものである必要があります。

誰もそのようなことの経験がありますか?私は Twilio にコミットしているわけではありません。私はまだ概念実証の段階にあるので、完全な代替案にも関心があります。

それは合理的なことのように思えますか。私はそれを試してみて気が狂ったことがありますか?すべての応答に感謝します。

完全を期すために-私はRazorエンジンを備えたMVC 3アーキテクチャを使用していますが、それはあまり関係がないと思います.

どうもありがとう

4

2 に答える 2

3

以下は、文字起こしを提供する 2 つの (私が知っている唯一の) API です。どちらも、ニーズに応じて、機械と人間の文字起こしを提供します。

VoiceCloud : 音声ファイル (mp3/wav) へのリンクを投稿すると、処理時にテキストがコールバック URL に送信されます。文字起こしは、機械による文字起こしの場合は 0.10 USD/分、人間の支援による場合は 0.009 USD/秒です。月額最低 $250.00 は、人による文字起こしにのみ適用されると思います。

QuickTate : XML-RPC 経由で音声ファイルまたはリンクを送信すると、QuickTate は完成した文字起こしをコールバック URL 経由で送信します。ジョブのステータスを確認して、部分的な文字起こしを取得することもできます。価格は前払いに依存し、医療品質も提供します。1 ワードあたり約 0.01 ドルから 0.025 ドルです。

私は両方を使用しましたが、高品質の文字起こしが必要な場合は、QuickTate をお勧めします (ただし、VoiceCloud は Twilio のネイティブ文字起こしの品質より優れています)。短いファイルが多い場合、VoiceCloud (私が使用したとき) の最小料金は 30 秒だったので、Quicktate の方が低コストになる可能性があります。

于 2012-07-14T13:47:10.607 に答える
0

グーグルボイス!

mp3を送信するのは、リアルタイムで再生する必要があるため少し注意が必要ですが、Google Voiceは自動的に音声メールを文字起こしし、私は個人的にそれらの文字起こしの否定的なレビューを聞いたことがありません。

私は最近、VoIPおよびVoicemailソリューションのレビューを行いましたが、GoogleVoiceがその大きな部分を占めていました。それらの文字起こしに深刻な問題があった場合、私はおそらく私の検索でそれらに遭遇したでしょう。

また、単なるボイスメールであり、電話の追加機能ではないGoogleVoiceLiteアカウントを設定することもできます。

于 2012-07-13T15:13:58.647 に答える