これを行うための最良のライブラリは何ですか。そして、頼りになる品質の良いenouchです。話者の声でシステムをトレーニングしたり、用語の辞書を使用して結果を改善したりすることはできません。
2398 次
1 に答える
3
Windowsでは、SAPIインターフェイス(Speech API)を使用します。複数の実装があります。Microsoftには、Windowsに無料のものが含まれています。Dragon NaturallySpeakingは、過去に同様のタスクに(努力を払って)使用された、無料ではないものです。話者がはっきりと話している場合(そして互いに重なり合ったり邪魔をしたりしていない場合)、トレーニングの欠如はそれほど深刻ではありません。
ただし、適切なトランスクリプトは取得できませんが、取得した内容がインデックス作成にのみ役立つほど精度が低くなります。大きな単語やユニークなフレーズは、特にカスタム辞書を作成する場合にうまく飛び出します(これはあなたがやりたくないと言ったことを私は知っています)。たとえば、「ペロシ」と「パブリックオプション」に言及しているすべてのニュースセグメントを検索します。
于 2009-11-19T17:05:05.553 に答える