audio - 自動転記ソフトウェア

Question

最近のスタックオーバーフローポッドキャストの一部の wiki の文字起こしが、ちょっと弱いことに気付きました。明らかに、このタスクにはコンピュータプログラムが必要です。オーディオをテキストに転記することは (誰が何を言ったかわかるように話者ラベルを付けるのが理想的です)、ソフトウェアで実現可能なものですか? そのような機能を実装しようとしているアクティブなオープンソースソフトウェアプロジェクトはありますか?

score 3 · Accepted Answer

私を信じてください、私はこれを以前に検索しました。オープンソースまたは無料で使用できるテキスト読み上げ機能はほとんどありません。私の検索では、言論の自由からテキストへのシンセサイザーはありませんでした。これらはコーディングが非常に難しく、費用もかかるため、オープンソースのアプローチでは実現できません。本当に必要な場合は、会社から購入する必要があります。（私は頭の上から何も知りませんが）。

score 2 · Accepted Answer

これを少し調べました。Microsoft Speech APIを試しましたが、結果が非常に悪くなりました。私はCMUSphinxプロジェクト、特にTranscriberデモを調べたいと思っていました。

audio - 自動転記ソフトウェア

2 に答える 2

Related