MySQL テーブルに TEXT ファイルがあります。それは文を持っています
例
Hello AAAA, where is your dog BBBB
Hello PPPP, where is your dog QQQQ
Hello XXXX, where is your dog YYYY
I am fine. thanks
I am fine. thanks
where are you going?
Thank you very much
ここで、最初の 3 つの文には 7 つの単語のうち 5 つの同じ単語があるため、(5/7)*100=72% 類似しています。
4 番目と 5 番目は 100% 類似
私の質問はです。PHPを使用して、このようなテーブルにグループ化したい
sample_sentence_group count
Hello AAAA, where is your dog BBBB 3
I am fine. thanks 2
where are you going? 1
Thank you very much 1
どうすればできますか?テーブルに 100K を超えるレコードがある
ありがとう