1

Wordから貼り付けたコンテンツにたくさんのタグがあるWebサイトを再設計しています。フォントタグのすべてのインスタンスを削除したいと思います。

また、通常使用されているすべてのインラインスタイルを削除したいと思います

<span style="font-family:Verdana, etc.;">...</span>

すべてのa、em、br、strongタグを保持したいので、コンテンツのスタイルに影響を与えるタグだけをすべて削除したくはありません。

このコンテンツはすべてMySQLデータベースにあり、PHPソリューションよりもMySQLソリューションの方が優先されますが、この時点でどちらかを取り上げます。

4

2 に答える 2

1

多分それは問題の最善の解決策ではありませんが、これが私がしていることです。データベースから情報を取得し、クリーンアップしてPHPでポストバックするために、いくつかの異なるスクリプトを試しましたが、実際にはうまく機能しませんでした。私が使用したものはすべて、データを台無しにしました。GIGO。

javascript(jQuery)を使用して、<font>タグからすべての属性を取り出し、すべての<span>タグと<p>タグのスタイル属性をクリアすることにしました。これを行った後、すべてが正常に見えます。将来のすべてのコンテンツはシステムに正しく入りますが、古いコンテンツはすべてデータベースにまだ醜いコードがあり、クライアント側で正しく表示できるようにクリーンアップされています。

于 2012-01-17T14:11:07.830 に答える
0

RegExpを使用してHTMLを解析することはできません。また、MySQLはデータの保存と取得を目的としており、データをフィルタリングするためのものではありません。

http://htmlpurifier.org/を使用して、PHPでHTMLをクリーンアップします。

于 2011-11-23T12:27:55.410 に答える