やあ。
URLリストがあります。このアドレスがファイルまたはディレクトリであることを確認する方法がわかりません。
例:
url = "http://example.com/path/to/file.html"
if '.' in url.split('/')[-1]:
return True
しかし、URLが
url = "http://example.com/path/domains/domain.com"
domain.com はファイルではなくディレクトリです。それを検出する方法は?
ファイルの拡張子を確認するのはよくありません。おそらくいくつかのヘッダーですか? しかし、インターネット転送の使用をできるだけ少なくしたいのです。
編集:
多数のリンクをダウンロードし、それらのパスをオペレーティング システムの場所にマッピングする必要があります。例: example.com/path/to/file.html
~/Downloads/example.com/path/to/
ここで file.html をダウンロードします。例えば:
example.com/directory/
create ~/Downlods/example.com/directory/
next url: example.com/directory/dir2
create ~/Downloads/example.com/directory/dir2
next url: example.com/directory/file.html
Download file.html in too ~/Downloads/example.com/directory/
not too create file.html directory