検索エンジンではなく、ユーザーと検索エンジンの間の架け橋を書いています。私の付加価値の一部は、クエリの意図を推測することです。追跡番号、銘柄記号、または住所の意図は明らかです。クエリを分類できれば、ユーザーが検索結果を表示する必要があるかどうかを判断できます。もちろん、それができない場合は、検索結果が表示されます。私は現在、この推論エンジンを設計しています。
私はパーサーを書いています。特定のトークンを取り、それにカテゴリを割り当てる必要があります。理論的な英語の例を次に示します。
- 「デンバー」は USCITY と PLACENAME です
- 「aapl」は NASDAQSYMBOL および STOCKTICKERSYMBOL です
- 「555 555 5555」は USPHONENUMBER です
これらのケースのそれぞれに特定の処理が必要になる可能性が高いことはわかっていますが、どこから始めればよいかわかりません。
理想的には、次のような単純なものになります。
queryCategory = magicCategoryFinder( query )
>print queryCategory
>"SOMECATEGORY or a list"