HTMLファイルをサニタイズしようとしていますが、正しく機能していません。段落タグと改行タグを除いて、すべてプレーンテキストにしたい。これが私のサニタイズコードです(ドットは、問題に関係のない私のクラスの他のコードを示します):
.
.
.
include ActionView::Helpers::SanitizeHelper
.
.
.
def remove_html(html_content)
sanitized_content_1 = sanitize(html_content, :tags => %w(p br))
sanitized_content_2 = Nokogiri::HTML(sanitized_content_1)
sanitized_content_2.css("style","script").remove
return sanitized_content_2
end
正しく機能していません。 これは、関数が入力を読み取っている元のHTMLファイルであり、これは、関数が返す「サニタイズされた」コードです。CSSタグ、JavaScript、およびHTMLコメントタグの本文に残ります。私が気づかなかったのは他のものにも残っているかもしれません。段落と改行タグ以外のすべてのCSS、HTML、JavaScriptを完全に削除する方法についてアドバイスしてください。