ここで明らかな何かが本当に欠けていると感じていますが、太字のタグの内容とタグの直前と直後の単語に一致する正規表現を探しています。
そう:
"start this string <b>is the text</b> we need end"
に一致します
"string <b>is the text</b> we"
タグとそのコンテンツ<b\s*>(.*?|[^>\s]+)<\/b\s*>
にアクセスできますが、先頭と末尾の単語を特定できないようです。
どんな助けでも大歓迎です。