url - 日本語でエンコードされた URL に遭遇すると Httrack に障害が発生する

翻译自：https://stackoverflow.com/questions/39760120 2016-09-29T01:47:49.323

278 次

通常は Httrack で問題はありませんが、今回は、次の日本語の URL のような非 ASCII 文字を含むページを取得できないことがわかりました。

domain.com/リーク情報真偽のほ/

(ブラウザでこのように読む: domain.com/E3%83%A0%E7%A3%A8%E3%81%8D%E3%82%82%E5%A4%A7%E4%BA%8B%EF% BC%81%E3%82%B9%E3%83%9E%E3%83%9B%E3%83%95%E3%82%A9%E3%83%BC%E3%83%A0%E3%81% A7%E3%81%AE%E6%9C%80%E9%81%A9%E3%81%AA-2/ )

Httrack はフォルダーの 50% を取得できますが、フォルダー内の html ファイルはすべて 0kb です。残りの 50% は文字列が完全に文字化けしており、同様に空です。

次に、DOS/ISO スパイダーオプションを試してみましたが、構造が大きく変わりすぎました (そして、すべてのファイル/フォルダーが大文字になります)。

これらの URL で httrack を正しく動作させる方法はありますか?

url - 日本語でエンコードされた URL に遭遇すると Httrack に障害が発生する

0 に答える 0

Related

Reference