Ruby を使用して、HTML ページのタグを削除したいと考えています。生の HTML があり、['span'、'li'、'div'] などのタグのリストを定義し、順番に実行できる正規表現の配列を作成したいと考えています。
clean_text = raw.gsub(first_regex,' ').gsub(second_regex,' ')...
タグごとに 2 つの正規表現 (開始と終了)。
これをプログラムで行う方法はありますか (つまり、タグ配列から正規表現配列を事前に構築し、流暢なパターンで実行します)?
編集:私は実際に一度に2つの質問をしたことに気づきました.1つ目はタグのリストを正規表現のリストに変換することについて、2つ目は正規表現のリストを流暢に呼び出すことについてです。両方の質問に答えてくれてありがとう。私は次の質問を単一のテーマにしようと思います。