14

音声録音を既知のテキストと同期させたいのですが。これを容易にする音声テキスト/自然言語処理ライブラリはありますか?単語の境界を検出し、辞書から候補の一致を計算したいと思います。私がSOで見つけた質問のほとんどは、書き言葉に関するものです。

必要ですが、必須ではありません:

  • オープンソース
  • すぐに使えるアメリカ英語と互換性があります
  • クロスプラットフォーム
  • 完全に文書化

編集:これは非常に広範で、素朴な質問であることに気づきました。ご指導いただきありがとうございます。

私がこれまでに見つけたもの:

  • OpenEars(iOS Sphinx / Fliteラッパー)
4

1 に答える 1

12

強制アライメント

オーディオと既知のテキストを強制的に調整したいようです。

強制アライメントは、音声とトランスクリプトの間に電話レベルのアライメントがないデータで認識システムをトレーニングする重要な部分であるため、ほとんどすべての研究/産業グレードの音声認識システムでこれを実行できます。

アライメントCMUSphinx

CMUのオープンソース音声認識システムのSphinx4-1.0ベータ5リリースには、トランスクリプトと長い音声録音を調整する方法のデモが含まれています。

于 2010-11-02T03:20:30.230 に答える