簡単な自動化を学ぼうとしています。Ubuntu サーバーをセットアップしましたが、特定の URL から html ソースをダウンロードし、1 分ごとにサーバー上の指定したフォルダー内のファイルに追加するように構成したいと考えています。
URL は基本的な html で、CSS はまったくありません。
私はPythonを使いたいのですが、確かにどの言語でも使用できます。これを行うのに適した簡単な日は何ですか?
簡単な自動化を学ぼうとしています。Ubuntu サーバーをセットアップしましたが、特定の URL から html ソースをダウンロードし、1 分ごとにサーバー上の指定したフォルダー内のファイルに追加するように構成したいと考えています。
URL は基本的な html で、CSS はまったくありません。
私はPythonを使いたいのですが、確かにどの言語でも使用できます。これを行うのに適した簡単な日は何ですか?
ジェフの答えは、1回限りの使用で機能します。これを行うと、繰り返し実行できます-
import time
import requests
while True:
with open('filename.extension', 'a') as fp:
newHtml = requests.get('url').text
fp.write(newHtml)
time.sleep(60)
これは、バックグラウンド プロセスとして必要なだけ実行できます。
$ python3 script_name.py &
requests ライブラリを pip インストールするだけです。
$ pip install requests
次に、HTML を取得するのは非常に簡単です (これを get_html.py という名前のファイルに入れるか、好きな名前を付けます):
import requests
req = requests.get('http://docs.python-requests.org/en/latest/user/quickstart/')
print(req.text)
HTML をディレクトリに保存するためのさまざまなオプションがあります。たとえば、次のように呼び出して、上記のスクリプトからの出力をファイルにリダイレクトできます。
python get_html.py > file.html
お役に立てれば