0

だから私たちは皆アイアンマンを見てきましたよね?個人的なプロジェクトとして、私はジャービスのようなAIを作成しようとしています。ジャービスほど洗練されたものは絶対に必要ありません。それは私が思いつくことができる最高の記述子です。

私は会話型AI(チャットボット)を調べることから始めましたが、それは私が必要としているものではありません。その方法は、私が探しているものとははるかに異なり、より複雑な方法でユーザー入力を処理するように感じます。必要なのは、aiにコマンドを与え、aiがそのコマンドと一致して、適切なコードを実行することだけです。

それで私はlibdiffに出くわしました。しかし、それは私の目的を十分に果たしていません。libdiffは、私が使用できる限り、文言が乱れている文字列とは一致しません。私の知る限り、少なくとも、libdiffが一致するためには、両方の文字列の文言の順序が同じである必要があります。

例:
ユーザー入力:「今何時ですか?」一致するはず
のコマンドと一致しません:「何時ですか?」

私はスプーンフィードのコードを求めていませんが、誰かが私を正しい方向に向けることができますか?

4

2 に答える 2

2

エキスパートシステムを構築しようとしています。

この本「人工知能のためのプロローグプログラミング-IvanBratko」をご覧ください。第14章では、エキスパートシステムについて説明しています。

于 2013-03-20T23:37:58.217 に答える
2

クールなプロジェクト、これが私の最初の考えです。まず、音声からテキストへの変換が必要になると思います。そうすれば、コマンドを効果的に処理できます。次に、その上にさらに洗練された方法を適用できます。https://code.google.com/p/dragonfly/がありますが、簡単なプロジェクトをハッキングするには少し多すぎることがわかりました。主にウィンドウをサポートしていると思います。ただし、この種のことに対して無料の休憩サービスを提供している人がいるかもしれません。グーグルはここで素晴らしい仕事をしていますhttp://updates.html5rocks.com/2013/01/Voice-Driven-Web-Apps-Introduction-to- the-Web-Speech-APIですが、Pythonバインディングはないと思います。

次に、次のタスクは、テキスト内の意味を見つけようとすることです。したがって、「what」や件名「time」などの疑問詞、または品詞のタグ付けを確認するには、パーサー(http://nltk.org/index.html )が必要です。もちろん、これを一般的な設定で正しく行うことはできます(任意の入力の場合ははるかに困難です)。いくつかの組み込みコマンドを用意して、後でより一般性を高める方がはるかに簡単な場合があります。

これをリアルタイムで実行したい場合は、リアルタイムのオーディオストリームをセグメント化して、文がいつ終了し、別の文がいつ開始するかを判断する必要があるため、さらに困難です。

ただし、最初にもっと単純な問題を解決したいとします。「開く」という単語のように、マイクを介して1つのコマンドを認識し、アクションを実行するとします。あなたがあなたの声を訓練する気があるならば、あなたはこれを非常に簡単に行うことができます。このhttp://xa.yimg.com/kq/groups/24321415/1523383180/name/Speech_Recognition_seminar.pdfによって動機付けられています。pyaudio、numpy、scipyが必要です。これをPythonで実装するコードを確認したい場合は、https://gist.github.com/a-wild-tigger/5209781を参照してください

于 2013-03-21T00:24:20.627 に答える