0

たくさんの html をプレーン テキスト形式で解析する場合、正規表現はすべてのアンカー タグを抽出して調べるための最良の方法ですか、それとも .net lib に組み込まれているものはありますか?

4

2 に答える 2

1

正規表現は良いです。ただし、HTML アジリティ パックはもう少し寛容であり、この状況で使用するものです。

于 2010-01-06T10:22:55.170 に答える
1

RegEx はあなたの仲間です。BCL に組み込まれている HTML パーサーはありません。

XHTML (または XML 準拠) を入力する場合は、XML と XPath を使用できます。ドキュメントを にロードし、すべてのノードXmlDocumentを選択します。a

于 2010-01-06T10:19:10.823 に答える