音声認識を C# と統合できますか? 私たちの方言を認識するアプリケーションを開発したいと思っています。スピーカーに依存しないようにするために、まだオーディオファイルを収集しています。
- どのモデルを使用すればよいですか? 言語か音響か?
- どのツールをお勧めしますか?
音声認識を C# と統合できますか? 私たちの方言を認識するアプリケーションを開発したいと思っています。スピーカーに依存しないようにするために、まだオーディオファイルを収集しています。
音声認識システムを作成することは非常に複雑なトピックであり、このテーマについて多くの論文が書かれています。ここにいくつかの素晴らしい紹介論文があります:
上記の論文は、スペクトル モデリング、特徴ベクトル抽出、クラスタリング、およびデータ マッピングの基本を扱っていますが、このような複雑な分類問題に対する私のお気に入りのアプローチは、常にニューラル ネットワーク ベースでした。以下は、さまざまな NN ベースのアプローチを扱った一連の論文です。
小さく始めて、少しずつシステムを構築することをお勧めします。幸運を!
好奇心から - どの言語をサポートする必要がありますか?
あなたはこの記事で試すことができます、それはとてもいいです
Microsoft Speech APIを試しましたか? MSDN には、C# 入門チュートリアルが含まれています。