2

システムの一部に Sphinx4 を使用したいと考えています。そして、マイクを直接使用する HelloWorld デモを既に試しました。また、音声ファイルの使用例も見てきました。

それで、私の質問は、音声を認識する他の方法があるかどうかということです? たとえば、短いタイプのデータ (short[]バッファなど) を認識します。

マイクやwavファイル(音声ファイル)以外に方法が見つかりません。

たとえば、PocketSphinx にはprocessRaw、この質問 ( Android での Pocketsphinx の入力) で説明されている機能があります。

Sphinx4に対応する機能はありませんか?

4

1 に答える 1

1

バイト配列からデータをフィードするには、次の手順を実行する必要があります。

  1. Microphone または AudioFileDataSource の代わりにStreamDataSourceを使用するようにフロントエンドを構成します。その方法の例については、LatticeDemo または TranscriberDemo を参照してください。

  2. データを含む byte[] 配列からByteArrayInputStreamを作成します

  3. StreamDataSource の setInputStream メソッドで ByteArrayInputStream を使用するように入力ストリームを設定する

  4. バイト配列からデータを認識するために、recognize()を実行します。

Socket や File からの入力データなど、InputStream を介して任意のデータを正常に使用できます。

于 2013-08-09T19:33:27.343 に答える