大きなファイルがあります。このファイルの各行は人間が入力した URL であるため、http欠落wwwなどのさまざまな問題が発生する可能性があります。
これらの URL を修復できる Python モジュールはありますか? url_fixから試してみましwerkzeug.urlsたが、探しているものとはまったく異なります。
www.example.com >> http://www.example.com/
もちろん、考えられるすべての間違いを修復できる方法はありませんが、最も一般的な間違いを修復する方法を探しています。
何かアドバイスはありますか?
編集: Peter Wood のコメントによると、URL にwww. 私の場合、それらは eshop URL です。