Web サイトで検索要求を処理するための組み込みエージェントを作成しようとしています。エージェントは、簡単な質問を処理し、回答のために一連の Web サイト リンクを提供できる必要があります。
すべての記事はデータベースにあります。各記事には、タイトル フィールドと、記事を分類するための一連のタグがあります。
この時点で、私の単純なアルゴリズムは次のようになります。
- 質問を一連の単語に分割します。
- 「a」、「the」、「how」などの一般的な単語をすべて削除します。
- 記事の本文、記事のタイトル、および残りの単語のタグを検索して、"where" 句を作成します。
- リストを表示します。タイトルが最初、タグが 2 番目、記事本文が 3 番目に一致する記事でランク付けされる可能性があります。
英語の質問を SQL クエリに変換するためのより良いアルゴリズムはありますか? 検索結果をさらに改善するために、記事の作成者が各記事とともに追跡する必要がある特定の詳細はありますか? 検索結果をさらに改善するために、検索が使用されている間に記録する必要のある詳細はありますか?
更新: Web サイトは、最新の ASP.NET を使用する IIS で実行されます。バックエンド データベースは SQL Server になります。