0

この質問と回答に続いて、私はまだ私が得る結果に少し問題があります、

例えば、

REGEXP '>[^<]*lau[[:>:]]'' lau 'にのみ一致しますが、正しい' laurence 'には一致しません。

REGEXP '>[^<]*men[[:>:]]'私が求めているものではない「エンパワーメント」と「女性」に一致します。

REGEXP '( |>|$)home( |<|$)'「ホーム」にのみ一致しますが、「ホーム」には一致しません'それがすべきです。

これらを正しく一致させるにはどうすればよいですか?

例えば、

Home - match
HOME - match
welcome home! - match
home is far! - match
hometown - not match
xxhomexx - not match
<a href="home.html">Hello</a> - not match
<p class="home">a box</p> - not match

htmlタグ内のどのオカレンスとも一致しないようする必要があります。故郷-一致しない

4

1 に答える 1

2

REGEXP '>[^<]*[[:<:]]home[[:>:]]' はどうですか?

その上、私はあなたのソリューションのパフォーマンスに本当に興味があります... テーブルに、html タグが削除されたテキストを含む別の列がないのはなぜですか。これにより、複雑な正規表現を使用する代わりに、全文検索を有効に活用できます。

于 2012-06-21T01:42:40.847 に答える