php - MySQL REGEXPは境界語のみに一致しますが、htmlタグの一致は除外します

Question

この質問と回答に続いて、私はまだ私が得る結果に少し問題があります、

例えば、

REGEXP '>[^<]*lau[[:>:]]'' lau 'にのみ一致しますが、正しい' laurence 'には一致しません。

REGEXP '>[^<]*men[[:>:]]'私が求めているものではない「エンパワーメント」と「女性」に一致します。

REGEXP '( |>|$)home( |<|$)'「ホーム」にのみ一致しますが、「ホーム」には一致しません。'それがすべきです。

これらを正しく一致させるにはどうすればよいですか？

例えば、

Home - match
HOME - match
welcome home! - match
home is far! - match
hometown - not match
xxhomexx - not match
<a href="home.html">Hello</a> - not match
<p class="home">a box</p> - not match

htmlタグ内のどのオカレンスとも一致しないようにする必要があります。故郷-一致しない

score 2 · Accepted Answer

REGEXP '>[^<]*[[:<:]]home[[:>:]]' はどうですか?

その上、私はあなたのソリューションのパフォーマンスに本当に興味があります... テーブルに、html タグが削除されたテキストを含む別の列がないのはなぜですか。これにより、複雑な正規表現を使用する代わりに、全文検索を有効に活用できます。

php - MySQL REGEXPは境界語のみに一致しますが、htmlタグの一致は除外します

1 に答える 1

Related

Reference