3

私はいくつかのhtmlをデータベースに保存しています。データベースに保存されているhtmlに追加の終了divがある</div>かどうかはわかりません。HTML文字列で余分な終了divを見つけたいです。HTMLアジリティパックを使用して見つけようとしましたが、これを達成する方法が見つかりません. 例:

<div class="readers">
    A total of 218 users are reading this article.
</div>
</div>
</div>

これら 2 つの余分な終了divを見つけて、完全に有効な html を抽出するにはどうすればよいですか。

4

2 に答える 2

0

HTML をレンダリングする前に、この純粋な JavaScript パーサーを使用してください: http://ejohn.org/blog/pure-javascript-html-parser/

ここにコードを貼り付けてチェックアウトできます。 http://ejohn.org/apps/htmlparser/</div>余分なs を削除します。

HTMLtoXML次のようにhtmlを関数に渡すだけです。

HTMLtoXML(your_html);

余分な終了タグを削除します。実際には、それは xml 形式に変換されますが、html ストリングを扱っているため、すべてのタグが html で有効であることが期待されるため、これを安全に使用できます。

編集: C# ファイルから JavaScript 関数を簡単に呼び出すことができます。詳細については、この質問を参照してください。

于 2012-06-21T08:20:30.937 に答える
-1

ここをクリックして、閉じられていない (ぶら下がっている) タグと追加の div タグの両方を検索します: tormus

于 2021-05-12T17:00:04.650 に答える