-1

サーバー上のSQLデータベースにデータを保存したい、さまざまなWebサイトのスクリーンスクレイピングを含む小さなプロジェクトを開始することを考えています。

私は数年前に C# と 'screen-scraper' と呼ばれるソフトウェアを使用してこのプロジェクトを行いましたが、これは私にとって大変な作業のほとんどを行ってくれました。今度はもっとうまくやりたい。今思い出せない理由で、サーバー上でスクリーンスクレイパーを実行することはできず、スクレイピング自体を行うために自分の別のコンピューターを常にオンにしておく必要があり、データはそこからサーバーにアップロードされていました..(おそらく私はただのバカでした)。

以前の Python の経験はありませんが、このタスクについて Python と Beautiful Soup について非常に良いことを聞いています。

最終的にはすべてをサーバー側で実行できるようにしたいので、Python スクリプトは 24 時間年中無休でサーバー上で実行され、SQL データベースを一定の頻度で更新します。他のコードもサーバー上に存在し、データベースなどからデータを操作するためにユーザーによって呼び出されます。

私は C ベースの言語の経験が豊富ですが、価値があれば Python を学ぶことも気にしません。正しい方向に向かっていることを確認したいだけです..

4

1 に答える 1

0

Python は優れており、おそらく最も人気のあるスクレイピングの選択肢です。ただし、美しいスープは独自の構文を使用するのに対し、lxml は xpath を使用するため、c プロジェクトでも役立つことがわかります。

于 2012-04-23T00:26:28.623 に答える