lxml.html.clean を使用してhtmlをサニタイズしています。すべてのタグから「スタイル」属性を削除しているようですが、私の目的では、スタイル属性を削除しないようにする必要があります。
許可を開始する前に、html のサニタイズ時にスタイル属性を削除しないことに関してセキュリティ上の影響があるかどうかを理解したいと思っています。
この問題に関する専門家からの洞察は高く評価されます。
(私のアプリケーションでは、バックエンド データベースに保存され、ページにレンダリングされる html をエンド ユーザーが作成できることに注意してください。上記の「クリーン」は、悪意のある html (javascript など) を html から削除してから保存するのに適しています。その後のレンダリング)。
feedparser ごとの HTML サニタイズ Web サイト- 「style」が「safe_attrs」のリストに存在しない
(また、これが歩行者の質問である場合は申し訳ありません。私はhtml /サニタイズおよび関連するセキュリティ面に不慣れです)