最初は、画像認識と同じくらい簡単だと思いました。
FANNホップフィールドネットワークを作成し、バイナリ変換された画像でトレーニング/フィードする代わりに、バイナリ変換されたサウンドでフィードします。
しかし:
- wavをバイナリ文字列に変換する方法(バイトではなくバイナリで必要だと思います-私は正しいですか?)
- 連続させる方法とは、マイクからの単語/音の発生をソースとして数えることです。
- これを行うのに最適なJavaライブラリは何ですか(SPHINXやその他の音声認識ライブラリではありません-コード言語を独立させたい、またはカスタムサウンドを認識したい-手をたたくなど)
以前は画像認識にFANNを使用していましたが、Encogについては知っていますが、モバイルデバイスに簡単に移植するためのより良いもの(またはより単純な、実際にはEncogの使用方法がわかりません)と望ましいJavaネイティブがあるかもしれません