0

既知の URL の特定のディレクトリにあるすべてのファイルをダウンロードしたいと考えています。ファイルの名前は必ずしも既知ではありませんが、それらの名前にはすべて共通のキーワードが含まれ、同じ拡張子 (.xml) が付けられます。

urllib2 の「os.walk」に相当するものはありますか?ディレクトリに存在するファイルを単純に見て、解析のために開くことができますか?

私がオンラインで見た唯一の例は、ディレクトリ内のすべてのファイル名のリストを含む既知の名前のファイルです。私はこれをしたくありません...

その他の関連情報: ファイルは Apache サーバー上にあり、パブリックにアクセスできます。

4

1 に答える 1

1

これは、ファイル名を知らなければ不可能です。この名前のファイルが存在するかどうかを知る唯一の方法は、URLを要求し、応答を受け取るかどうかを確認することであるため、考えられるすべての名前をランダムに試す必要があります。ただし、Apache Webサーバーに(mod_autoindexを使用して)ディレクトリインデックスを生成させ、これを解析してファイル名を取得することもできます。

于 2012-06-21T17:55:59.933 に答える