ここの HTTrack ドキュメントの例に従っています: http://httrack.kauler.com/help/User-defined_structure
スクレイピングする必要があるサイトには、次の構造の URL があります。
https://www.example.com/index.php?HelpTopics
https://www.example.com/index.php?MoreHelp
等
HTTrack を使用して、サイトをダウンロードし、ファイルを次の形式で保存したい
HelpTopics.html
MoreHelp.html
等
上記のリンクから変更されたコマンドラインでこれを使用しています:
httrack "https://www.example.com" %n%[index.php?:-:::].%t
しかし、私はまだすべてのファイルindex2b26.html
をindex2de7.html
などとして保存しています。
HTTrack オプションのどこが間違っていますか? 元のサイトにファイル拡張子がないため、これは壊れていますexample.com
か?