2

最近のスタック オーバーフロー ポッドキャストの一部の wiki の文字起こしが、ちょっと弱いことに気付きました。明らかに、このタスクにはコンピュータ プログラムが必要です。オーディオをテキストに転記することは (誰が何を言ったかわかるように話者ラベルを付けるのが理想的です)、ソフトウェアで実現可能なものですか? そのような機能を実装しようとしているアクティブなオープンソース ソフトウェア プロジェクトはありますか?

4

2 に答える 2

3

私を信じてください、私はこれを以前に検索しました。オープン ソースまたは無料で使用できるテキスト読み上げ機能はほとんどありません。私の検索では、言論の自由からテキストへのシンセサイザーはありませんでした。これらはコーディングが非常に難しく、費用もかかるため、オープン ソースのアプローチでは実現できません。本当に必要な場合は、会社から購入する必要があります。(私は頭の上から何も知りませんが)。

于 2009-08-14T02:21:35.227 に答える
2

これを少し調べました。Microsoft Speech APIを試しましたが、結果が非​​常に悪くなりました。私はCMUSphinxプロジェクト、特にTranscriberデモを調べたいと思っていました。

于 2009-09-18T17:16:52.450 に答える