c# - 特定のクラス名が含まれている場合、テキストファイルから DIV を削除する

Question

現在、RSS フィードを含む XML ドキュメントを扱っています。そして、「feedflare」というクラス名の div タグが見つかった場合に、コードが DIV 全体を削除するように解析したいと考えました。

「HTMLエディターエラー」やその他の無関係なデータで検索が汚染されているため、これを行う例を見つけることができませんでした。

私の目標を達成するための方法を共有するのに十分親切な人はいますか?

回避できる場合は、HtmlAgilityPack を使用したくないと述べなければなりません。

これは私のプロセスです：

XML を読み込み、要素を解析して、タイトル、説明、リンクを選択します。次に、これらすべてを HTML として保存し (プログラムでタグを追加して Web ページを作成します)、すべてのタグが追加されたら、結果の「HTML テキスト」を解析し、煩わしい DIV タグを削除します。

"string HTML = textBox1.text" と仮定しましょう。ここで、textBox1 は、メインの XML ドキュメントを解析した後、結果の HTML が貼り付けられる場所です。

次に、textBox1.text の内容をループして、「feedflare」という div タグのみを削除するにはどうすればよいでしょうか (以下を参照)。

<div class="feedflare">
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:yIl2AUoC8zA">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?d=yIl2AUoC8zA" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:H0mrP-F8Qgo">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?d=H0mrP-F8Qgo" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:D7DqB2pKExk">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?i=lB-zYAGjzDU:1zqeSgzxt90:D7DqB2pKExk" border="0"></img></a> 
<a href="http://feeds.gawker.com/~ff/kotaku/full?a=lB-zYAGjzDU:1zqeSgzxt90:V_sGLiPBpWU">
<img src="http://feeds.feedburner.com/~ff/kotaku/full?i=lB-zYAGjzDU:1zqeSgzxt90:V_sGLiPBpWU" border="0"></img></a>
</div>

前もって感謝します。

score 0 · Accepted Answer

この xml ライブラリを使用して、次のことを行います。

XElement root = XElement.Load(file); // or .Parse(string);
XElement div = root.XPathElement("//div[@class={0}]", "feedflare");
div.Remove();
root.Save(file); // or string = root.ToString();

score 0 · Accepted Answer

これを試して

   System.Xml.XmlDocument d = new System.Xml.XmlDocument();
   d.LoadXml(Your_XML_as_String);
    foreach(System.Xml.XmlNode n in d.GetElementsByTagName("div"))
   d.RemoveChild(n);

を使用d.OuterXmlして、新しい xml を取得します。

c# - 特定のクラス名が含まれている場合、テキスト ファイルから DIV を削除する

3 に答える 3

Related

Reference

c# - 特定のクラス名が含まれている場合、テキストファイルから DIV を削除する