Web フォームから HTML 形式のコンテンツを収集しています。この HTML コンテンツを保存する前に、簡単なサニティ チェックを行い、適切な形式 (閉じられていないタグや無効なマークアップがない) に見えることを確認したいと思います。
Ruby や一般的な gem を使用して、次のような HTML フラグメント文字列を確認できますか?
<p>foo</p><h1>Unclosed H1<p>bar</p>
h1
閉じられていないタグのようなものを発見しますか?
ここでノコギリが助けに来てくれると思ったが、違う:
>> Nokogiri::HTML::DocumentFragment.parse("<p>foo</p><h1>Unclosed H1<p>bar</p>").errors
=> []