mysql - MySQL で行内の単語の出現回数をカウントする

Question

データベースから関連する結果を見つける、自分の Web サイトの検索機能を作成しています。単語の出現回数をカウントする方法を探していますが、単語の両側に単語の境界があることを確認する必要があります (したがって、「リッピング」が必要なときに「トリプル」になってしまうことはありません)。

誰にもアイデアはありますか？

人々は私の質問を誤解しています:

単一の行内でそのような発生回数をカウントするにはどうすればよいですか?

score 2 · Accepted Answer

これは、リレーショナルデータベースが得意とする類のものではありません。ただし、フルテキストインデックスを使用できず、InnoDB を使用しているため使用できないと既に述べている場合を除きます。関連する行を選択し、アプリケーションコードでワードカウントを行うことをお勧めします。

score 1 · Accepted Answer

この倒錯した方法を試すことができます：

SELECT 
(LENGTH(field) - LENGTH(REPLACE(field, 'word', ''))) / LENGTH('word') AS `count`
ORDER BY `count` DESC

このクエリは非常に遅くなる可能性があります
かなり醜く見える
REPLACE() は大文字と小文字を区別します

score 0 · Accepted Answer

このようなものが機能するはずです：

フィールド名REGEXP'[[：<：]] word [[：>：]]';のテーブルからcount（*）を選択します。

厄介な詳細は、MySQLマニュアルのセクション11.4.2にあります。

score 0 · Accepted Answer

検索が必要な場合は、Sphinx や Lucene などをお勧めします。Sphinx は (独立した全文インデクサーとして) セットアップと実行がはるかに簡単です。高速に実行され、インデックスを非常に高速に生成します。MyISAM を使用していたとしても、それを使用することをお勧めします。MyISAM の全文索引よりもはるかに強力です。

また、MySQL と (ある程度) 統合することもできます。

score 0 · Accepted Answer

LIKE や REGEXP などはスケーリングされません (左端のプレフィックスが一致しない限り)。

代わりに、やりたいことにフルテキストインデックスを使用することを検討してください。

select count(*) from yourtable where match(title, body) against ('some_word');

score 0 · Accepted Answer

以下のリンクで説明されている手法を使用しました。このメソッドは、 MySQL の使用lengthと機能を使用します。replace

キーワードの関連性

score -3 · Accepted Answer

使用している DBMS によって異なりますが、これを実行できる UDF を作成できるものもあります。

mysql - MySQL で行内の単語の出現回数をカウントする

9 に答える 9

Related

Reference