python - Web サイトのソースをフォルダーにダウンロードするスクリプト

Question

簡単な自動化を学ぼうとしています。Ubuntu サーバーをセットアップしましたが、特定の URL から html ソースをダウンロードし、1 分ごとにサーバー上の指定したフォルダー内のファイルに追加するように構成したいと考えています。

URL は基本的な html で、CSS はまったくありません。

私はPythonを使いたいのですが、確かにどの言語でも使用できます。これを行うのに適した簡単な日は何ですか?

score 0 · Accepted Answer

ジェフの答えは、1回限りの使用で機能します。これを行うと、繰り返し実行できます-

import time
import requests

while True:
    with open('filename.extension', 'a') as fp:
        newHtml = requests.get('url').text
        fp.write(newHtml)
    time.sleep(60)

これは、バックグラウンドプロセスとして必要なだけ実行できます。

$ python3 script_name.py &

score 0 · Accepted Answer

requests ライブラリを pip インストールするだけです。

$ pip install requests

次に、HTML を取得するのは非常に簡単です (これを get_html.py という名前のファイルに入れるか、好きな名前を付けます):

import requests

req = requests.get('http://docs.python-requests.org/en/latest/user/quickstart/')

print(req.text)

HTML をディレクトリに保存するためのさまざまなオプションがあります。たとえば、次のように呼び出して、上記のスクリプトからの出力をファイルにリダイレクトできます。

 python get_html.py > file.html

お役に立てれば

python - Web サイトのソースをフォルダーにダウンロードするスクリプト

2 に答える 2

Related

Reference