.net - XmlDocumentは検証せずにXmlをロードします

Question

次のような悪いxmlがあります：

NaN&lt;/td>&lt;td id=&quot;DemTechLimit8&quot;>NaN&lt;/td>&lt;td id=&quot;DemCommercLimit8&quot;>NaN&lt;/td>&lt;td id=&quot;AoValue8&quot;>NaN&lt;/td>&lt;/tr>&lt;tr>&lt;td id=&quot;DemInt9&quot;>8:00 - 9:00
&lt;/td>&lt;td id=&quot;DemValue9&quot;>1&lt;/td>&lt;td id=&quot;DemValueDeclined9&quot;>NaN&lt;/td>&lt;td id=&quot;CalcValue9&quot;>NaN&lt;/td>&lt;td id=&quot;LoadLoss9&quot;>NaN&lt;/td>&lt;td id=&quot;DemTechLimit9&quot;>NaN&lt;/td>&lt;td id=&quot;DemCommercLimit9&quot;>NaN&lt;/td>&lt;td id=&quot;AoValue9&quot;>NaN&lt;/td>&lt;/tr>&lt;tr>&lt;td id=&quot;DemInt10&quot;>9:00 - 10:00
&lt;/td>&lt;td id=&quot;DemValue10&quot;>1&lt;/td>&lt;td id=&quot;DemValueDeclined10&quot;>NaN&lt;/td>&lt;td id=&quot;CalcValue10&quot;>NaN&lt;/td>&lt;td id=&quot;LoadLoss10&quot;>NaN&lt;/td>&lt;td id=&quot;DemTechLimit10

検証やdtdなしでXmlDocumentにロードするにはどうすればよいですか？

これはデジタル署名用であるため、特殊文字を置き換えたり、フォーマットしたりすることはできません。

これがJSの例ですが、.NETコードが必要です。

xmldoce.async = false;
xmldoce.validateOnParse = false;
xmldoce.preserveWhiteSpace = false;
xmldoce.resolveExternals = false;
xmldoce.loadXML(...);

編集：

そのコンテンツをスキーマで定義されたオブジェクトにロードする必要があります。

<complexType name="ObjectType" mixed="true">
<sequence minOccurs="0" maxOccurs="unbounded">
<any namespace="##any" processContents="lax"/>
</sequence> 
</complexType>

たぶんそれはXmlDocumentなしで可能ですか？

score 1 · Accepted Answer

xmlではありません。htmlのようです。あなたはそれを次のようにデコードすることができます

var html = HttpUtility.HtmlDecode(input);

そしておそらくそれを解析するためにHtmlAgilityPackが必要になるでしょう。

以下の例は、文字列からいくつかの有用なものを抽出します

var html = HttpUtility.HtmlDecode(input);
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var result = doc.DocumentNode.Descendants("tr")
              .Select(tr=>tr.Descendants("td").Select(td => td.InnerText).ToList())
              .ToList();

.net - XmlDocumentは検証せずにXmlをロードします

1 に答える 1

Related

Reference