java - SQLで最も一般的な単語を見つける.

Question

新しい問題があります。さまざまなテキストを含む列を持つデータベースがあります。これらのフィールドで使用される最も一般的な 10 の単語を SQL に教えてもらう方法はありますか? 例として：

1 今日は少し遅く帰宅します。
2 電車が遅れています。
3 今日の電車のダイヤは？
4 雪は今とても悪いです。

そして、最適な出力は次のようになります。

is: 3 遅れ: 2 電車: 2 今日: 2

SQL でそれができない場合、この情報を得るために他に何を調べることをお勧めしますか?

score 3 · Accepted Answer

これは技術的には SQL で実行できる可能性がありますが、データベースにさらに多くの行があると、面倒で非常に遅くなります。

あなたが説明している問題は、 Luceneなどのインデックス作成エンジンの完璧な使用例です(あなたの質問には編集前に最初にタグ「java」が含まれていたため、これを例として使用しました)。

score 0 · Accepted Answer

1 つのオプションは、各単語を行として返すテーブル値分割関数を使用することです。それらを数える ; それらをカウントで降順に並べ替えます

2 に答える 2