1

URL を取得し、次のように呼び出してすべてのコンテンツを取得します。

CQ dom = ...;
string content = dom.Text();

「Text()」メソッドが次のような HTML コメントも抽出していることに気付きました。

<html>
<body>
<!-- This is comment - Ignore me -->
</body>
</html>

これらのコメントをすべてコードから削除するオプションを探しています。このようなもの:

dom["comment"].remove();

これは可能ですか?

ありがとう

4

1 に答える 1

2

解決策を見つけました。

dom の作成は次のように行う必要があります。

CQ.Create(stream, Encoding.UTF8, HtmlParsingMode.Auto, HtmlParsingOptions.IgnoreComments);

HtmlParsingOptions.IgnoreCommentsは私が探していたものでした。

于 2015-10-24T12:01:09.373 に答える