python - NAOロボットの未知語音声認識

Question

Python でプログラムされた NAO ロボットを含むプロジェクトを実行する必要があります。私がしなければならないことは、NAOに何が示されているかについての知識を割り当てることです.

例えば：

NAOに絵（ホワイトボードに手書き）を見せる人
その人は「家」と言います（その人が家を描いたとしましょう）
NAOは、示されている絵が家を表していることを知っています

私が遭遇した問題は、音声認識モジュールにあります。特定の語彙の単語のみを認識できました。しかし、私のプロジェクトの設定では、ホワイトボードに絵を描いて、そこに描かれているものをNAOに伝える必要があります。つまり、その人が何を描こうとしているのかわからないし、事前に語彙を設定することもできません。

私の出発点は、このチュートリアル hereです。チュートリアルを読むとわかるように、次のコード行のように、語彙に属する特定の単語のみを認識できます。

wordList=["yes","no","hello Nao","goodbye Nao"]
asr.setWordListAsVocabulary(wordList)

認識中に、WordRecognized というイベントが発生します。次のような構造になっています。

Event: "WordRecognized"
callback(std::string eventName, AL::ALValue value, std::string subscriberIdentifier)

ALSpeechRecognitionProxy::setWordListAsVocabulary() で指定された単語の 1 つが認識されたときに発生します。現在認識されている単語がない場合、この値は再初期化されます。

私の答えの鍵はここにあると思いますが、助けが必要です。どうすればこの問題を解決できますか? 私が参照できるより良いドキュメントはありますか？

前もって感謝します！

score 2 · Accepted Answer

The problem is that NAO speech recognition module is proprietary and I highly doubt you can do such things with it.

However, if you consider ROS platform and open source engine like CMUSphinx you can definitely do what you want. It's easy to include placeholder word to a grammar which will be matched against an unknown word and later be placed in the dictionary.

これは、音声インタラクションによって語彙を学習するための非常に複雑な研究課題ですが、以前に行われました。例として、この出版物を読むことができます

固有名詞の自動音声表記のための複合システム A. Laurent、T. Merlin、S. Meignier、Y. Esteve、P. Deleglise

http://www.lrec-conf.org/proceedings/lrec2008/pdf/455_paper.pdf

唯一のことは、非常に低いレベルで認識機能を使用したいということです。

python - NAOロボットの未知語音声認識

1 に答える 1

Related

Reference