私が実行しようとしているwgetダウンロードがあります。
ファイルタイプ(ジャンクファイルなど)を制限し始めない限り、数千のファイルをダウンロードします。理論的には、ファイルの種類を制限することは問題ありません。
ただし、ファイル拡張子なしでダウンロードできるファイルがたくさんあります。たとえば、Adobe で手動で開いた場合、実際には PDF です。これらは実際に私が欲しいファイルです。
wget をファイルタイプ PDF に制限しても、これらのファイルはダウンロードされません。
これまでのところ、私の構文はwget -r --no-parent A.pdf www.websitehere.com です。
wget -r --no-parent www.websitehere.comを使用すると、すべてのファイル タイプが表示されるので、理論上はすべてのファイルを取得できます。しかし、これは、何千ものジャンク ファイルを削除し、名前を変更する必要がある未知のファイル タイプの有用なファイルを数百個持っていることを意味します。
適切なファイル拡張子でファイルを wget して保存する方法についてのアイデアはありますか?
または、wget をファイル拡張子のないファイルのみに制限し、別のバッチ メソッドを使用してファイルの種類を特定し、適切に名前を変更する方法はありますか?
すべてのファイルを手動でテストして適切なアプリケーションを判断するには、多くの時間がかかります。
どんな助けにも感謝します!