いくつかのページからデータを取得する必要があります。データはhtmlテーブルに格納されます。それらをデータベースに保存するSQLファイルを生成したいと思います。私の目的の1つは、これらの結果です。
サイトを処理する最も簡単な方法はJavaScriptですが、各サイトでスクリプトを実行して結果をハードドライブに書き込む方法はありますか?
htmlで動作するために必要なライブラリがあれば、wgetを使用して必要なすべてのサイトをダウンロードし、Pythonで処理することもできます。
いくつかのページからデータを取得する必要があります。データはhtmlテーブルに格納されます。それらをデータベースに保存するSQLファイルを生成したいと思います。私の目的の1つは、これらの結果です。
サイトを処理する最も簡単な方法はJavaScriptですが、各サイトでスクリプトを実行して結果をハードドライブに書き込む方法はありますか?
htmlで動作するために必要なライブラリがあれば、wgetを使用して必要なすべてのサイトをダウンロードし、Pythonで処理することもできます。
私が正しく理解していれば、基本的にWebからコンテンツを取得して、データベースに保存する必要があります。
ライブラリを使用してWebページをクロールurllib2
し、必要なコンテンツ(regexp、BeautifulSoupなど)に応じて何らかの方法で解析するPythonスクリプトを使用する可能性があります。
この質問を見てください:PythonによるWebスクレイピング