Webページ上のすべてのリンクを次の形式で検索しようとしている"http://something"
かhttps://something.
、正規表現を作成しましたが、機能します:
L = re.findall(r"http://[^/\"]+/|https://[^/\"]+/", site_str)
しかし、これを短く書く方法はありますか?おそらく必要なく ://[^/\"]+/ を2回繰り返しています。さまざまなことを試しましたが、機能しません。試しました:
L = re.findall(r"http|https(://[^/\"]+/)", site_str)
L = re.findall(r"(http|https)://[^/\"]+/", site_str)
L = re.findall(r"(http|https)(://[^/\"]+/)", site_str)
ここに何かが欠けているか、Pythonの正規表現を十分に理解していないことは明らかです。