私は現在、特定の URL からさまざまなデータを取得するプログラムに取り組んでいます。このために、URL をくまなく調べて、ソース コードからすべての場所の配列を作成する関数があります。これは完全に機能し、ページなどではなく、ファイルがあるかどうかを確認するためにページをフィルタリングすることができました..
私の問題は、メニューオプションの下にサブページがあるメニューを持ついくつかのサイトでこれをテストしたことです. ナビゲーション バーのメイン オプションにはページ値があり、サブナビゲーションの最初のオプションは同じページですが、URL の末尾に値があります (主に JavaScript を切り替えるため)。ページをエンコードして比較してみましたが (処理時間を短縮するため)、一部のサイトでは URL がフォーム フィールドに入力されています。
Example:
Option1 - www.example.com/page1
- first opt - www.example.com/page1?t=1
- second opt - ww.example.com/page1?t=2
一部のサイトではこれらの値のみを使用し、他のページでは JS を使用しているため、見かけから追加のタグを削除することはできません。URL は技術的に異なるため、URL が異なっていてもページが同じかどうかを確認する方法はありますか?