5

私は、ユーザーが無料で広告を投稿できる (PHP と Mysql の) 分類された Web サイトを持っています。しかし、ユーザーは重複した広告を投稿することがよくあります。このスクリプトでは、完全に重複したコンテンツを投稿することはできないため、1 つか 2 つの文字を変更することによってこれを行っています。

重複した広告を見つけてユーザーに警告する方法はありますか (ユーザーがテキストの一部を変更した場合でも)?

私のサイトは PHP と Mysql です。検索にはsphixを使用しています。これをmongodbとapache solrに変更することを考えています。

4

3 に答える 3

2

行って略奪する

2 つの文字列の類似度を計算する http://php.net/manual/en/function.similar-text.php

また

2 つの文字列間のレーベンシュタイン距離を計算する http://www.php.net/manual/en/function.levenshtein.php

于 2013-06-09T22:16:15.110 に答える
0

文を単語に分割し、各単語をテーブルと照合して、データベースで一致のパーセンテージを見つける関数を作成できます。パーセンテージに基づいて、決定を下すことができます。データベースのチェックを減らすために、配列に格納できる一般的な単語と動詞を削除できます。これは私の個人的な意見ですが、他にもっと良いテクニックがあるかもしれません。しかし、それは良い質問だと言わざるを得ません。

于 2013-06-08T14:44:00.090 に答える