Androidアプリ内でオフライン音声認識を作成できるライブラリを探しています。私のアプリには、最大15個の短い(1単語)コマンドで構成される簡単な語彙があります。私の場合、応答時間は非常に重要です。
実行可能なオフラインオプション(無料および有料)はありますか?Sphinxのオフラインバージョンを知っていますが、応答が最も速いオプションになりますか(ここでも、音声認識機能全体ではなく、いくつかのコマンドを認識するためにアプリが必要なだけです)?
Androidアプリ内でオフライン音声認識を作成できるライブラリを探しています。私のアプリには、最大15個の短い(1単語)コマンドで構成される簡単な語彙があります。私の場合、応答時間は非常に重要です。
実行可能なオフラインオプション(無料および有料)はありますか?Sphinxのオフラインバージョンを知っていますが、応答が最も速いオプションになりますか(ここでも、音声認識機能全体ではなく、いくつかのコマンドを認識するためにアプリが必要なだけです)?
このタイプのアプリケーションにPocketSphinxを使用することに成功しました。PocketSphinxデモアプリを作成し、オンラインのsphinx lmtoolを使用して、コマンドの短いリストの言語モデルを作成し、応答時間のニーズを満たしているかどうかを確認することをお勧めします。onResults
コールバックが十分に高速でない場合は、onPartialResults
ほぼ即座に返されるコールバックを使用できます。これが私が行うことであり、パフォーマンスに満足しています。デモアプリには、UIにも小さなタイマーが組み込まれています。
オンラインlmtoollm
を使用する場合は、ファイルとそれが生成するファイルからファイルを取得し、それらを使用して、デモのセットアップ手順で指定されている言語モデルの対応するファイルをdict
置き換えることができます。lm
dict
構築するのは少し面倒でしたが、NDKを使用するのは初めてでした。
キーワードスポッティングソフトウェアをお探しですか?Sensoryinc.comはこれを何年にもわたって行っており、最近になっていくつかのAndroidアプリを作成しました。これは私が運転していて、音声トリガーを使用して音声メモを録音したい例です。「ハローブルージニー」と言って初めて、オーディオノートの録音が始まります。 http://vimeo.com/64658273 (私はSensoryで働いていませんが、彼らの技術は非常に過小評価されていると思います)