1

現在、RSS フィードを含む XML ドキュメントを扱っています。そして、「feedflare」というクラス名の div タグが見つかった場合に、コードが DIV 全体を削除するように解析したいと考えました。

「HTMLエディターエラー」やその他の無関係なデータで検索が汚染されているため、これを行う例を見つけることができませんでした。

私の目標を達成するための方法を共有するのに十分親切な人はいますか?

回避できる場合は、HtmlAgilityPack を使用したくないと述べなければなりません。

これは私のプロセスです:

XML を読み込み、要素を解析して、タイトル、説明、リンクを選択します。次に、これらすべてを HTML として保存し (プログラムでタグを追加して Web ページを作成します)、すべてのタグが追加されたら、結果の「HTML テキスト」を解析し、煩わしい DIV タグを削除します。

"string HTML = textBox1.text" と仮定しましょう。ここで、textBox1 は、メインの XML ドキュメントを解析した後、結果の HTML が貼り付けられる場所です。

次に、textBox1.text の内容をループして、「feedflare」という div タグのみを削除するにはどうすればよいでしょうか (以下を参照)。

<div class="feedflare">
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:yIl2AUoC8zA">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?d=yIl2AUoC8zA" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:H0mrP-F8Qgo">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?d=H0mrP-F8Qgo" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:D7DqB2pKExk">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?i=lB-zYAGjzDU:1zqeSgzxt90:D7DqB2pKExk" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:V_sGLiPBpWU">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?i=lB-zYAGjzDU:1zqeSgzxt90:V_sGLiPBpWU" border="0"></img></a>
</div>

前もって感謝します。

4

3 に答える 3

0

この xml ライブラリを使用して、次のことを行います。

XElement root = XElement.Load(file); // or .Parse(string);
XElement div = root.XPathElement("//div[@class={0}]", "feedflare");
div.Remove();
root.Save(file); // or string = root.ToString();
于 2012-06-22T13:35:29.427 に答える
0

これを試して

   System.Xml.XmlDocument d = new System.Xml.XmlDocument();
   d.LoadXml(Your_XML_as_String);
    foreach(System.Xml.XmlNode n in d.GetElementsByTagName("div"))
   d.RemoveChild(n);

を使用d.OuterXmlして、新しい xml を取得します。

于 2012-07-11T00:42:41.093 に答える