speech-recognition - 音声データを Sphinx4 に直接渡す方法

Question

システムの一部に Sphinx4 を使用したいと考えています。そして、マイクを直接使用する HelloWorld デモを既に試しました。また、音声ファイルの使用例も見てきました。

それで、私の質問は、音声を認識する他の方法があるかどうかということです? たとえば、短いタイプのデータ (short[]バッファなど) を認識します。

マイクやwavファイル（音声ファイル）以外に方法が見つかりません。

たとえば、PocketSphinx にはprocessRaw、この質問 ( Android での Pocketsphinx の入力) で説明されている機能があります。

Sphinx4に対応する機能はありませんか?

score 1 · Accepted Answer

バイト配列からデータをフィードするには、次の手順を実行する必要があります。

Microphone または AudioFileDataSource の代わりにStreamDataSourceを使用するようにフロントエンドを構成します。その方法の例については、LatticeDemo または TranscriberDemo を参照してください。
データを含む byte[] 配列からByteArrayInputStreamを作成します
StreamDataSource の setInputStream メソッドで ByteArrayInputStream を使用するように入力ストリームを設定する
バイト配列からデータを認識するために、recognize()を実行します。

Socket や File からの入力データなど、InputStream を介して任意のデータを正常に使用できます。

1 に答える 1