1

ソースが完全に有効でない XHTML ファイルがあり、XML ドキュメントの DTD に従っていません。

"forを使用し&Idquo;たり、アポストロフィを使用したりする場所があるように’。これにより、C# コードで例外が発生します。

これを取り除くために使用できる方法またはWebリンクはありますか?

4

3 に答える 3

4

ファイルが他の点で整形式である場合は、独自のDTDで文字エンティティを定義できます。

ファイルの形式が正しくない場合、CodePlexのHTMLAgilityPackがファイルを解析します

于 2009-05-08T18:27:48.090 に答える
1

どちらも最終的に DOM になり、HTML パーサーはこれらのパンジーな引用符の問題を嘲笑するため、代わりにドキュメントを HTML として解析できます。unknown の HTML Tidy のアイデアに従って、DOM をシリアライズして有効な XHTML ファイルに戻すことができます。(これは、HTML Tidy を使用するのと同じですが、おそらく HTML パーサーを使用しますが、C# からプログラムで行う場合を除きます。)

于 2009-05-08T18:24:27.193 に答える
0

XML の性質上、有効である必要があります。有効でないと、まったくレンダリングされません。まず、W3C のバリデーターhttp://validator.w3.org/で生成されるエラーの種類を確認します。

また、XML を修正するように構成できる HTML tidy の使用も検討してください。

hpricot を使用して XML を修正しますが、ここでも Rails アプリを作成しています。C#についてよくわからない

于 2009-05-08T18:12:36.987 に答える