7

Ruby (Rails) アプリケーションで CMU Sphinx を使用する方法を探しています。私は非常に単純なタスクを必要としています - 私は mp3 ファイルを持っていて、それをテキストに書き起こしたいと思っています。

この最も簡単な方法を実装するにはどうすればよいですか? 私は C/C++ を知りませんし、私の仕事は C/C++ を学ぶほど大きなものではありません :)

手伝ってくれてありがとう!

4

3 に答える 3

10

CMUSphinxは、音声認識機能を活用するために使用できるいくつかのインターフェイスを提供します。それらのいくつかはあなたにより適しているかもしれませんが、いくつかはそうではありません:

  1. コマンドラインツールを使用し、Railsアプリケーションから外部バイナリとして実行して、必要な結果を取得します。実行するツールはpocketsphinx_continuousです。Railsからバイナリを呼び出す方法の詳細については、質問「 herokuでバイナリを実行する方法」を参照してください。

  2. JVMを使用してJRubyからSphinx4フレームワークを呼び出すことができます。たとえば、JRubyからSphinx4を使用する方法については、 http: //cmusphinx.sourceforge.net/wiki/tutorialsphinx4#writing_scriptsを参照してください。

  3. SWIGを使用してpocketsphinxバインディングを実装できます。簡単な部分は、Pythonのswigラッパーがpocketsphinxの一部としてすでに存在していることです。SWIGを使用してRubyラッパーを生成する必要があります:https ://sourceforge.net/p/cmusphinx/code/11643/tree/trunk/ Pocketsphinx / swig /

  4. 最後に、JavaRESTフレームワークを使用してRESTWebを実装し、CMUSphinxツールを使用してオーディオをテキストに変換し、Rubyコードからサービスを呼び出すことができます。詳細については、RailsからRESTを使用する方法を参照し てください。この方法で、システムを本当にスケーラブルにすることができます。

于 2012-11-09T12:23:07.057 に答える
3

私は最近、これを行うための宝石を作成しました:

https://github.com/watsonbox/pocketsphinx-ruby

Ruby 外部関数インターフェイス (FFI) を使用して、libpocketsphinx と直接対話します。

于 2014-10-21T17:49:48.010 に答える
1

PocketSphinx を使用するこの Ruby ベースの音声認識 Web サービスを調べてみてください。

https://github.com/alumae/ruby-pocketsphinx-server

于 2012-11-12T22:40:11.410 に答える