0

いくつかのページからデータを取得する必要があります。データはhtmlテーブルに格納されます。それらをデータベースに保存するSQLファイルを生成したいと思います。私の目的の1つは、これらの結果です。

サイトを処理する最も簡単な方法はJavaScriptですが、各サイトでスクリプトを実行して結果をハードドライブに書き込む方法はありますか?

htmlで動作するために必要なライブラリがあれば、wgetを使用して必要なすべてのサイトをダウンロードし、Pythonで処理することもできます。

4

1 に答える 1

1

私が正しく理解していれば、基本的にWebからコンテンツを取得して、データベースに保存する必要があります。

ライブラリを使用してWebページをクロールurllib2し、必要なコンテンツ(regexp、BeautifulSoupなど)に応じて何らかの方法で解析するPythonスクリプトを使用する可能性があります。

この質問を見てください:PythonによるWebスクレイピング

于 2013-01-24T23:05:51.470 に答える