0

私は、さまざまなWebサイトに追加または削除されたhtmlタグの変更率を計算するための統計的な式を見つけようとしています。

したがって、たとえば、私が書いているスクレーパーを使用して、初期タグカウントを取得し、その値をキャッシュします。その後、次のラウンドで、取得した現在のタグ数と過去のタグ数を比較し、変化率の違いに基づいてパーセンテージを計算します。

Webサイトがスクレイピングされた回数、これらのスクレイプが発生した日付など、その他の要因もここに含まれます。

この性質の何かのための理想的な公式は何でしょうか?

4

1 に答える 1

2

タグのカウントは問題ありません。さらに、テーブルツリーまたはdivツリーとその深さを探すこともできます。

たとえば、

<div>
  <div>
    <div> .. </div>
  </div>
</div>
depth is 3
于 2012-08-14T18:16:08.473 に答える