HTML/リンク構造のフィンガープリント/検証方法についてのあなたの意見を知りたいだけです.
私が解決したい問題は、たとえば 10 の異なるサイト、html ページのフィンガープリントです。そして、しばらくしてから、それらを検証できるようにしたいと考えています。サイトが変更された場合、リンクが変更された場合、検証が失敗した場合、そうでない場合は検証が成功した場合です。私の基本的なアイデアは、リンク構造を何らかの方法で分割し、ある種のツリーを実行して分析し、そのツリーからある種のコードを生成することです。しかし、私はまだブレインストーミングの段階にあり、誰かとこれについて話し合い、他のアイデアを知る必要があります.
したがって、アイデア、アルゴリズム、および提案は役に立ちます。