11

オーディオファイルを取得して解析し、そこからテキストを抽出できるビルドインライブラリまたはJavaまたはC#の外部ライブラリがあるかどうかを知りたいだけです。

申請する必要がありますが、どこから始めればいいのかわかりません。

4

5 に答える 5

12

オプションのいくつかを次に示します。

于 2010-10-18T11:27:50.083 に答える
8

これは、C#とSystem.Speechを使用した完全な例です。

コードは2つの主要な部分に分けることができます:

SpeechRecognizedイベントとSpeechHypothesizedイベントを処理するSpeechRecognitionEngineオブジェクト(およびその必須要素)を構成します。

ステップ1:SpeechRecognitionEngineを構成する

_speechRecognitionEngine = new SpeechRecognitionEngine();
_speechRecognitionEngine.SetInputToDefaultAudioDevice();
_dictationGrammar = new DictationGrammar();
_speechRecognitionEngine.LoadGrammar(_dictationGrammar);
_speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

この時点で、オブジェクトはマイクからの音声の転写を開始する準備ができています。ただし、実際に結果にアクセスするには、いくつかのイベントを処理する必要があります。

ステップ2:SpeechRecognitionEngineイベントの処理

_speechRecognitionEngine.SpeechRecognized-= new EventHandler(SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized-= new EventHandler(SpeechHypothesizing);

_speechRecognitionEngine.SpeechRecognized + = new EventHandler(SpeechRecognized); _speechRecognitionEngine.SpeechHypothesized + = new EventHandler(SpeechHypothesizing);

private void SpeechHypothesizing(object sender、SpeechHypothesizedEventArgs e){///エンジン文字列からのリアルタイム結果realTimeResults = e.Result.Text; }

private void SpeechRecognized(object sender、SpeechRecognizedEventArgs e){///エンジン文字列からの最終回答finalAnswer = e.Result.Text; }

それでおしまい。マイクの代わりに録音済みの.wavファイルを使用する場合は、

_speechRecognitionEngine.SetInputToWaveFile(pathToTargetWavFile);

それ以外の

_speechRecognitionEngine.SetInputToDefaultAudioDevice();

これらのクラスにはさまざまなオプションがあり、さらに詳しく調べる価値があります。

http://ellismis.com/2012/03/17/converting-or-transcribing-audio-to-text-using-c-and-net-system-speech/

于 2012-03-17T17:09:48.313 に答える
1

SoX(サウンド処理プログラムのスイスアーミーナイフ)を使用して、オーディオファイルをサウンドの周波数/音量に対応する数値のテキストファイルに変換できます。

以前のプロジェクトで実行しましたが、正確なコマンドオプションがわかりません。

プロジェクトへのリンクは次のとおりです:http ://sox.sourceforge.net/Main/HomePage

于 2012-01-10T23:46:07.533 に答える
1

MicrosoftSpeechAPIを確認してください。彼らはあなたがあなたの目的のために使うことができるSDKを提供すると思います。

于 2010-10-18T11:14:09.393 に答える
1

Javaの場合、Sunからの解決策があるようです:javax.speech.recognition

于 2010-10-18T13:35:50.900 に答える