RSS を使用するアプリケーションを作成したいと考えています。RSS フィードのアイテム説明に、画像、リンク、br などの一部のアイテムを HTML として表示できるようにしたいと考えています。車輪の再発明もしたくありません。正しいレベルの HTML だけを取り除くライブラリはありますか?
私が直面している問題は、phpBB から RSS フィードを生成しているため、投稿には既に br および a (リンク) タグが含まれていることです。ただし、ユーザーはスクリプト タグを投稿に貼り付けることができ、適切にエンコードされてページにテキストとして表示されます。
しかし、RSS リーダーで投稿を見ると、投稿内のすべての html が < および > などとしてエンコードされています。これにより、br タグと (less than)script(greaterthan) タグの区別が曖昧になります。どちらも & lt ; そして & gt;
これはもっと簡単なはずだと思いますが、明らかな何かが欠けているだけです...願っています。