python - ROS pocketphinx + gstreamer 発話を wav ファイルに記録

翻译自：https://stackoverflow.com/questions/28820282 2015-03-02T22:01:34.033

431 次

私は、ASR 結果と対応するオーディオファイルの両方を入力として取得する必要がある対話システムに取り組んでいます。私は Ubuntu 14.04 で ROS indigo を使用し、ASR からのテキストとそれぞれのオーディオファイルの両方を受け取るために、 recognizer.py ( http://docs.ros.org/indigo/api/pocketsphinx/html/recognizer_8py_source.html ) を編集します。認識された発話。gst パイプラインを次のように変更しました。

    self.launch_config += " ! audioconvert ! audioresample  ! tee name=t ! queue ! audioresample " \
                        + '! vader name=vad auto-threshold=true ' \
                        + '! pocketsphinx name=asr ! fakesink dump=1 t. ! valve drop=0 ! queue ! wavenc ! filesink location=test.wav async=0'

しかし、私がなんとかしたことは、認識機能が停止するまですべてのオーディオ信号を記録することでした (例: ^C)。さらに私は後に使用しようとしました

self.pipeline.set_property('rawlogdir', 'folder_name/') 101行目

しかし、GstPipeline にはプロパティ「rawlogdir」がないようです

必要なのは、ROS ポケットフィンクスノードを使用した音声処理 (感情認識) に必要な、認識された発話の音声信号を取得することだけです。

どんなアイデアでも本当に役に立ちます！

python - ROS pocketphinx + gstreamer 発話を wav ファイルに記録

1 に答える 1

Related

Reference