新しい問題があります。さまざまなテキストを含む列を持つデータベースがあります。これらのフィールドで使用される最も一般的な 10 の単語を SQL に教えてもらう方法はありますか? 例として:
1 今日は少し遅く帰宅します。
2 電車が遅れています。
3 今日の電車のダイヤは?
4 雪は今とても悪いです。
そして、最適な出力は次のようになります。
is: 3 遅れ: 2 電車: 2 今日: 2
SQL でそれができない場合、この情報を得るために他に何を調べることをお勧めしますか?
これは技術的には SQL で実行できる可能性がありますが、データベースにさらに多くの行があると、面倒で非常に遅くなります。
あなたが説明している問題は、 Luceneなどのインデックス作成エンジンの完璧な使用例です(あなたの質問には編集前に最初にタグ「java」が含まれていたため、これを例として使用しました)。
1 つのオプションは、各単語を行として返すテーブル値分割関数を使用することです。それらを数える ; それらをカウントで降順に並べ替えます