Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私の WAVには、最初と最後に小さなブーンという音があります。このファイルは Sphinx トレーニングに適していますか? はいの場合、文字起こしファイルに特殊文字を含める必要がありますか?
ありがとうございます。よろしくお願いします。
まず、wav をカットしてサウンドを削除するだけです。
次に、wav が 1 つしかない場合、何をトレーニングしても意味がなく、大量のデータが必要になります。
文字起こし、モデル、語彙などに特別なサウンド「バズ」を追加して、それを説明できます。できればなくした方がいいと思います。ただし、マイクが常にブーンという場合は、そのままにしておくこともできます。
一般に、トレーニング データは、システムが使用されるのと同じ条件下で記録する必要があります。