Ruby (Rails) アプリケーションで CMU Sphinx を使用する方法を探しています。私は非常に単純なタスクを必要としています - 私は mp3 ファイルを持っていて、それをテキストに書き起こしたいと思っています。
この最も簡単な方法を実装するにはどうすればよいですか? 私は C/C++ を知りませんし、私の仕事は C/C++ を学ぶほど大きなものではありません :)
手伝ってくれてありがとう!
Ruby (Rails) アプリケーションで CMU Sphinx を使用する方法を探しています。私は非常に単純なタスクを必要としています - 私は mp3 ファイルを持っていて、それをテキストに書き起こしたいと思っています。
この最も簡単な方法を実装するにはどうすればよいですか? 私は C/C++ を知りませんし、私の仕事は C/C++ を学ぶほど大きなものではありません :)
手伝ってくれてありがとう!
CMUSphinxは、音声認識機能を活用するために使用できるいくつかのインターフェイスを提供します。それらのいくつかはあなたにより適しているかもしれませんが、いくつかはそうではありません:
コマンドラインツールを使用し、Railsアプリケーションから外部バイナリとして実行して、必要な結果を取得します。実行するツールはpocketsphinx_continuousです。Railsからバイナリを呼び出す方法の詳細については、質問「 herokuでバイナリを実行する方法」を参照してください。
JVMを使用してJRubyからSphinx4フレームワークを呼び出すことができます。たとえば、JRubyからSphinx4を使用する方法については、 http: //cmusphinx.sourceforge.net/wiki/tutorialsphinx4#writing_scriptsを参照してください。
SWIGを使用してpocketsphinxバインディングを実装できます。簡単な部分は、Pythonのswigラッパーがpocketsphinxの一部としてすでに存在していることです。SWIGを使用してRubyラッパーを生成する必要があります:https ://sourceforge.net/p/cmusphinx/code/11643/tree/trunk/ Pocketsphinx / swig /
最後に、JavaRESTフレームワークを使用してRESTWebを実装し、CMUSphinxツールを使用してオーディオをテキストに変換し、Rubyコードからサービスを呼び出すことができます。詳細については、RailsからRESTを使用する方法を参照し てください。この方法で、システムを本当にスケーラブルにすることができます。
私は最近、これを行うための宝石を作成しました:
https://github.com/watsonbox/pocketsphinx-ruby
Ruby 外部関数インターフェイス (FFI) を使用して、libpocketsphinx と直接対話します。
PocketSphinx を使用するこの Ruby ベースの音声認識 Web サービスを調べてみてください。