0

1500 のカテゴリ (複数を含む単数形の単語) を含むかなり大きなカテゴリ テーブルがあり、タイトルによってこれらのカテゴリに新製品を一致させる最良の方法を探しています。

正規表現を使用してキーワードの製品説明をループすることを検討してきましたが、一度に 1,000 個を超える製品を追加しようとすると、これはあまり効率的ではありません。全文検索 (FREETEXT とを含む) しかし、FreeText 検索は、製品説明のすべての単語に一致するため、多くの結果が返されるようです。

製品がその説明によってどのカテゴリであるかを自動化し、アドバイスやポインタを提供できるという点で、誰かが同様のことをしましたか?

4

1 に答える 1

1

私が理解している質問は、説明が与えられた場合、この説明がどのカテゴリに適用されるか教えてください。

この種の作業を行う一般的な方法は、単純ベイジアン分類プロセスを構築し、すべての記述をこれに通すことです。

このような分類は、通常 2 段階で行われます。

ステージ 1 : 既知の説明/カテゴリのペアを使用して、分類器を「トレーニング」します。

ステージ 2 : 分類器がトレーニングされると、不明なデータを与えることができます。これにより、説明が特定のカテゴリに一致する確率が返されます。

このアプローチの分類器は通常かなり正確ですが、統計を扱っていることを考えると、エラーは通常忍び込みます

于 2012-04-18T15:41:25.497 に答える