9

私が実行しようとしているwgetダウンロードがあります。

ファイルタイプ(ジャンクファイルなど)を制限し始めない限り、数千のファイルをダウンロードします。理論的には、ファイルの種類を制限することは問題ありません。

ただし、ファイル拡張子なしでダウンロードできるファイルがたくさんあります。たとえば、Adobe で手動で開いた場合、実際には PDF です。これらは実際に私が欲しいファイルです。

wget をファイルタイプ PDF に制限しても、これらのファイルはダウンロードされません。

これまでのところ、私の構文はwget -r --no-parent A.pdf www.websitehere.com です。

wget -r --no-parent www.websitehere.comを使用すると、すべてのファイル タイプが表示されるので、理論上はすべてのファイルを取得できます。しかし、これは、何千ものジャンク ファイルを削除し、名前を変更する必要がある未知のファイル タイプの有用なファイルを数百個持っていることを意味します。

適切なファイル拡張子でファイルを wget して保存する方法についてのアイデアはありますか?

または、wget をファイル拡張子のないファイルのみに制限し、別のバッチ メソッドを使用してファイルの種類を特定し、適切に名前を変更する方法はありますか?

すべてのファイルを手動でテストして適切なアプリケーションを判断するには、多くの時間がかかります。

どんな助けにも感謝します!

4

1 に答える 1