7

音声をテキストに変換し、タイムスタンプを保持する無料のサービス/プログラムはありますか?

書き写したい:

これはVoiceBaseのデモリンクです

(419人の詐欺師の間の16mの会話。詐欺師は強いアクセントで話すので、文字起こしの品質について不満はありません)。

Voicebaseはそれを書き起こしますが、書き起こしは単一のテストブロックであり、タイムスタンプは付けられません。

また、Googleの音声「トリック」(ファイルをボイスメールに録音し、Googleに一度に3分間文字起こしさせる)も試しましたが、繰り返しになりますが、文字起こしは1ブロックのテキストであり、タイムスタンプは付けられていません。

Sphinxを知っていますが、動作させることができませんでした。

私はsubtitleeditorを使用して手動の文字起こしを作成できることに気付きましたが、自動化されたソリューションを探しています。

理想的には、タイムスタンプ付きのマシンの文字起こしを取得して、手作業で編集したいと思います。

4

3 に答える 3

4

CMUSphinxはこれを行うことができ、ソースからAlignerデモを実行するだけです。最新のsphinx4チュートリアルは、sphinx4チュートリアルで入手できます。2014年の夏、CMUSphinxはsphinx4トランクに長いオーディオアライメント機能を統合しました。

それは完全に間違っていますが、音声ベースとは異なり、少なくともいくつかの単語をキャプチャしました。おそらく、手動で書き写し、後で時間を割り当てる方が簡単です。CMUSphinxは、オーディオとテキストの配置でこれを行うこともできます。

アクセントやショートトークによるデコード精度にはかなりの問題がありますが、あなたにも責任があります。たとえば、8kHz帯域幅の電話オーディオをmp3に変換しないでください。このような変換により、自動音声認識の精度と全体的な録音品質が大幅に低下します。圧縮には、他の音声指向の可逆コーデックを使用できます。

主題を議論する他の質問、いくつかの推奨事項をリストします。

于 2013-04-01T13:37:02.003 に答える
0

グーグルで検索している間、あなたは市場の専門家によって供給されている転写ソフトウェアの長いリストを得るでしょう。いくつかの例は次のとおりです。

  1. エクスプレススクライブ
  2. EureScribe
  3. InqScribe

しかし、自動化されたソフトウェアの使用中に発生した問題は、必要な正確な結果が得られないことです。したがって、これらのソフトウェアの使用でまだ問題が発生する場合は、作業を容易にするために文字起こしを雇うことができます。

于 2013-12-26T11:21:22.963 に答える
0

Speechlogger(https://speechlogger.appspot.com)という名前の新しいソフトウェア(chrome web-app)は、まさにその目的のために作成されました。タイムスタンプを保持し、 srt(キャプション)形式にエクスポートできます。

それはグーグルの音声認識エンジンを利用しているので、それはそこにある最高の技術であると思われます。また、(単純な単語の内容と構造に基づいて)自動句読点を付けます。

于 2014-10-04T17:58:30.257 に答える