1

ここの HTTrack ドキュメントの例に従っています: http://httrack.kauler.com/help/User-defined_structure

スクレイピングする必要があるサイトには、次の構造の URL があります。

https://www.example.com/index.php?HelpTopics

https://www.example.com/index.php?MoreHelp

HTTrack を使用して、サイトをダウンロードし、ファイルを次の形式で保存したい

HelpTopics.html MoreHelp.html

上記のリンクから変更されたコマンドラインでこれを使用しています:

httrack "https://www.example.com" %n%[index.php?:-:::].%t

しかし、私はまだすべてのファイルindex2b26.htmlindex2de7.htmlなどとして保存しています。

HTTrack オプションのどこが間違っていますか? 元のサイトにファイル拡張子がないため、これは壊れていますexample.comか?

4

2 に答える 2