音声録音を既知のテキストと同期させたいのですが。これを容易にする音声テキスト/自然言語処理ライブラリはありますか?単語の境界を検出し、辞書から候補の一致を計算したいと思います。私がSOで見つけた質問のほとんどは、書き言葉に関するものです。
必要ですが、必須ではありません:
- オープンソース
- すぐに使えるアメリカ英語と互換性があります
- クロスプラットフォーム
- 完全に文書化
編集:これは非常に広範で、素朴な質問であることに気づきました。ご指導いただきありがとうございます。
私がこれまでに見つけたもの:
- OpenEars(iOS Sphinx / Fliteラッパー)