大きなファイルがあります。このファイルの各行は人間が入力した URL であるため、http
欠落www
などのさまざまな問題が発生する可能性があります。
これらの URL を修復できる Python モジュールはありますか? url_fix
から試してみましwerkzeug.urls
たが、探しているものとはまったく異なります。
www.example.com >> http://www.example.com/
もちろん、考えられるすべての間違いを修復できる方法はありませんが、最も一般的な間違いを修復する方法を探しています。
何かアドバイスはありますか?
編集: Peter Wood のコメントによると、URL にwww
. 私の場合、それらは eshop URL です。