1

文字列に格納されたHTMLテーブルがあります

string tbl  = "<table calls='report'><tr><th>head</th><th>name</th></tr><tr><td>Department name</td><td>Mike</th></tr></table>";

この文字列をループして XML ファイルに書き込むにはどうすればよいですか?

私はファイルをXMLに書き込むことができると思いますが、問題は文字列をどのようにまたはループして、tの内容を識別し、それをどのように解析するかです。

ありがとう

4

1 に答える 1

1

HTML は既に XML であるため、そのままにして目的を達成することができます。しかし、意味的に意味のあるタグ名が必要だと思います。

HTML Agility Packを試すことができます。これにより、XDocument や Linq-to-XML で実行できる方法と同様に、オブジェクト モデルに対するクエリを作成できます。私は引用します:

これは、読み取り/書き込み DOM を構築し、プレーンな XPATH または XSLT をサポートするアジャイル HTML パーサーです (実際には、使用するために XPATH や XSLT を理解する必要はありません。心配はいりません...)。これは、「Web から」HTML ファイルを解析できる .NET コード ライブラリです。パーサーは、「実際の」不正な HTML に対して非常に寛容です。オブジェクト モデルは、System.Xml を提案するものと非常に似ていますが、HTML ドキュメント (またはストリーム) 用です。

XPATH などに慣れていない場合は、Linq もサポートしています。

于 2013-01-28T23:23:08.827 に答える