2

毎日のデータのCRUDのためだけにDjangoアプリを持っています。
モデルは価格と日付のみです。

モデルに新しいデータを自動的に (毎日) 挿入するコードを書く必要があります。

Web ページの解析にBeautifulSoupを使用する予定です。

だから私はいくつかの質問があります:

  1. タスクを 1 日 1 回実行するように設定するには、crontab (crontab -e による手動編集) を使用する予定です。よりスマートなソリューションはありますか?

  2. Django ORM を使用するか、別のスクリプトで SQL を記述する必要がありますか?

長期的には何が良いのかアドバイスを探しています。このような仕事が増えます。

ありがとう

4

2 に答える 2

1

この回答は、より一般的なアーキテクチャの回答です...

まず、すべてを django で行うことができます。

セロリと定期的なタスクを設定します: http://docs.celeryproject.org/en/latest/userguide/periodic-tasks.html

実際のクロールでは、おそらくリンク検出でファンアウトする必要があります... @task デコレーターだけを使用して、セロリを使用することもできます。

django:/// ブローカーを使用してプロジェクトを開始します。サイズが決まったら、RabbitMQ に進みます。

于 2013-06-05T08:00:51.787 に答える