Ruby で HTML 用のホワイトリスト ベースのサニタイザーを見たことがありますが、反対のことが必要です。PDF 変換の準備を整えるには、ページから削除されたリンクのみが必要です。サニタイズを試しましたが、取得したページでどの HTML 要素が使用されるかを推測するのが難しすぎて、リストに追加できるようにするのが難しいため、必要なものには合いません。
私の入力が
<a href="link">Link!</a>
<b>Bold Text</b>
<div>A div!</div>
私はしたいです
Link!
<b>Bold Text</b>
<div>A div!</div>
出力になります。
Ruby用の「ブラックリストベースのサニタイザー」はありますか?