通常は Httrack で問題はありませんが、今回は、次の日本語の URL のような非 ASCII 文字を含むページを取得できないことがわかりました。
domain.com/リーク情報真偽のほ/
(ブラウザでこのように読む: domain.com/E3%83%A0%E7%A3%A8%E3%81%8D%E3%82%82%E5%A4%A7%E4%BA%8B%EF% BC%81%E3%82%B9%E3%83%9E%E3%83%9B%E3%83%95%E3%82%A9%E3%83%BC%E3%83%A0%E3%81% A7%E3%81%AE%E6%9C%80%E9%81%A9%E3%81%AA-2/ )
Httrack はフォルダーの 50% を取得できますが、フォルダー内の html ファイルはすべて 0kb です。残りの 50% は文字列が完全に文字化けしており、同様に空です。
次に、DOS/ISO スパイダー オプションを試してみましたが、構造が大きく変わりすぎました (そして、すべてのファイル/フォルダーが大文字になります)。
これらの URL で httrack を正しく動作させる方法はありますか?