1

こんにちは、私は AI の短期コースを受講し、AIML と Python に基づいてチャットボットを設計しました。私は何らかの形式のセマンティック検索エンジンを設計するという新しいタスクを抱えています。人々がデータをナビゲートしたり、質問を検索したりして、結果を提供できるようにしたいと考えています。最初は、交通や地理などの特定のトピック向けになります。ユーザーからのサンプル入力:

  1. x から y に移動するのにいくらかかりますか?

    回答: 26 ドルかかります

  2. x は z からどのくらい離れていますか?

    回答: 25 マイルです

  3. ユーザーはお気に入りのルートを追加できるので、「お気に入りのルートを追加」と入力するだけで、ユーザーは f ルートを入力するように求められます。

    回答: お気に入りのルートにエントリを追加しますか?

    ユーザー:はい。

    Ans: 好きなルートを入力してください。

  4. 私の共通ルートを表示します。

    回答: 一般的なルートは x、y、z です。

そのため、検索されるデータはユーザーに固有のものである可能性があるため、データベースを使用する必要がある場合があります。一部のデータは外部にあるため、Google マップを呼び出して距離を問い合わせることができます。一部の質問には、チャットボットからの応答のみが必要な場合があります。

では、ユーザー入力時に何をすべきですか? それをトークン化し、ステム処理し、解析しますか?

どこかでAIMLを使用したいと思っていましたが、http://knytetrypper.proboards.com/index.cgi?board=gbot&action=print&thread=285を読んだ記事。AIML はパターン マッチングにのみ適していると述べています。誰かが私を正しい方向に向けてください。NLTK をダウンロードしました。便利そうですが、それ自体で必要なことができるかどうかはわかりません。

同様のプロジェクトの記事はありますか?

4

1 に答える 1

1

これは本当に難しい問題です。入力を非常に小さなスペースに制限すると、実行可能になります。ただし、その時点では語彙を使用しているだけで、可能なクエリごとに基本的なコマンドがあります。

クエリの種類を区別するには、いくつかの方法があります。1) 解析してそのすべての情報を使用しようとする 2) 部分解析/pos タグ - 動詞を検索する 3) pos を特徴、距離、単語/構造として使用する機械学習/分類アプローチ「へ」/「から」

...そして、クエリを正しく分類したら、クエリパラメーターを引き出すことができます。

それがどのような種類のクエリであるかがよくわかるまで、解析を行うことは避けます。分類アプローチが最良の最初のステップであり、その NLTK をいじるには非常に便利です。

于 2012-05-31T17:14:42.117 に答える