2

複雑で重い HTML ページを解析したいと考えています。私は最近 CsQuery について読み、 CsQuery Vs Html Agility Pack と Fizzlerのパフォーマンス比較を確認しました。これらのテストによると、CsQuery は DOM の作成時にインデックスの作成のために遅くなります。

重い html ページの特定の要素 (ID なし) を選択したいとしましょう。その先祖の ID を知っていて、それをコンテキスト要素として使用します。この重い html を DOM にロードすると、処理が遅くなるため、選択が遅くなります。ただし、HTMLをSOMEHOW FAST前処理し、コンテキスト要素(私が知っているID)を含むサブストリングを取得してDOMにロードできる場合は、より高速になります。その場合、インデクサーが作成されない不要な HTML を大量に削除したことになります。したがって、私の選択はより速くなります。

JQueryのようなものが欲しいので、CsQueryを使用しています。

私の質問は:

HTMLドキュメント文字列が与えられた場合:IDを指定してHTML要素のHTML部分文字列を取得する高速な方法(例:線形)はありますか?

4

1 に答える 1