0

HTMLページがあります

table.html
<table border="1">
<tr>
<td>row 1, cell 1</td>
<td>row 1, cell 2</td>
</tr>
<tr>
<td>row 2, cell 1</td>
<td>row 2, cell 2</td>
</tr>
</table>

lynx -dumpこのページに移動して、html テーブルのデータを mysql データベースに挿入できるようにしたいと考えています (HTML ページには常に同じ見出しがありますが、データは毎日変更されます。

このスクリプトを実行してから cron に追加したいので、現在のようにデータを手動で入力する必要はありません!

私は今のところ本当に立ち往生しているので、とにかくこれを行う方法を知っている人はいますか?

ありがとう

4

1 に答える 1

0

私は既製の解決策を知りません。Python コーディングを恐れていないのであれば、BeautifulSoup を使用して HTML 内をナビゲートするのは非常に簡単だと思います (それ自体はそれほど簡単な作業ではありません)。

次のようなものがあります:

from bs4 import BeautifulSoup
import MySQLdb
db=MySQLdb.connect(passwd="xxx",db="xxx")
c=db.cursor()

soup = BeautifulSoup(html_file)

tr_list=soup.find_all("tr")
for tr in tr_list:
  cell1=tr.find_all("td")[0]
  cell2=tr.find_all("td")[1]
  #do your sql insert here
  c.execute ("SQL query here")
c.close()
于 2013-06-28T16:31:29.887 に答える