たくさんの html をプレーン テキスト形式で解析する場合、正規表現はすべてのアンカー タグを抽出して調べるための最良の方法ですか、それとも .net lib に組み込まれているものはありますか?
2 に答える
1
正規表現は良いです。ただし、HTML アジリティ パックはもう少し寛容であり、この状況で使用するものです。
于 2010-01-06T10:22:55.170 に答える
1
RegEx はあなたの仲間です。BCL に組み込まれている HTML パーサーはありません。
XHTML (または XML 準拠) を入力する場合は、XML と XPath を使用できます。ドキュメントを にロードし、すべてのノードXmlDocument
を選択します。a
于 2010-01-06T10:19:10.823 に答える