ネットワーク上に、テーブル内の新しい行でほぼ毎分更新される html ファイルがあります。任意の時点で、ファイルには 15000 近くの行が含まれており、テーブル内のすべてのデータを含む MySQL テーブルを作成し、利用可能なデータからさらにいくつかのデータを計算します。
上記の HTML テーブルには、たとえば過去 3 日間の行が含まれています。それらすべてを mysql テーブルに保存し、1 時間ごとにテーブルを更新したい (これは cron 経由で実行できますか?)
DBへの接続には、正常に動作するものを使用しMySQLdb
ています。ただし、そうするためのベストプラクティスが何であるかはわかりません。を使用してデータをスクレイピングし、 をbs4
使用してテーブルに接続できますMySQLdb
。しかし、どのようにテーブルを更新すればよいでしょうか? リソースの使用量が最も少ないページをスクレイピングするには、どのロジックを使用すればよいですか?
私は結果を取得していません。スクレイピングして書いているだけです。
ポインタはありますか?