Webページをスクレイピングしようとしています。
URL を指定して Web ページをダウンロードし、すべての画像とともにオフラインで読むために保存したいと考えています。多くのディレクトリが作成されるため、wgetでそれを行うことはできません。
これはwgetで可能ですか?ディレクトリを作成し、HTML ページで必要なすべてのリソースをそのディレクトリに配置する、FireFox の「名前を付けて保存」オプションのようなものはありますか?
このノコギリやメカナイズは可能でしょうか?
ブリキ男が与えた答えは仕事をしました。 これは Nokogiri を使用して、非常にクリーンなディレクトリ構造でオフラインで読むために写真付きの 1 ページをダウンロードする方法を示しています。