0

そのため、テキストだけなどの特定のデータを抽出し、そのデータをデータを整理するプログラムにプッシュする方法を見つけようと探し回っています。

たとえば、homedepot.com を例に取り、「2x4 木材」の下にリストされている各アイテムから抽出したい場合、各アイテムから名前、説明、仕様を取得し、そのデータをソフトウェアにインポートする必要があります。このデータが含まれていますか?

それは自動データ入力のようなものだと思いますか?

私が調査したことから、特定の用語を検索し、結果が返すすべてのページをクロールして必要なデータを取得するように設計されたクローラー プログラムを作成する必要があります。

ただし、ちょっとした問題があります。プログラミングやスクリプトの知識がまったくなく、どこから始めればよいかわかりません。Python をベースにした Scrapy と呼ばれるものを見つけました。これはクローラーに使用したいものですか?

次の問題は、収集したデータをソフトウェアにインポートする方法がわからないという事実です。この答えを見つけるためにどこを見るべきかについてのヒントはありますか?

スクリプトの作成方法を学ぶのを手伝わなければならないというこの考えを利用したいと思います。

4

2 に答える 2

0

おそらく、一般的に言語を学ぶことから始めるべきでしょう。

しかし、Web の場合は、urllib と urllib2 と呼ばれるものを使用できます。これらは、実際にウィンドウを開かなくてもブラウザを開いてデータを取得できます。

また、実際にウィンドウを開く Selenium のような自動化された Web ブラウザーもいくつかあります。

インターネットで見ることができる他の多くのものがあります

しかし、それはWebブラウザの自動化にすぎないので、実際に必要な情報とデータを取得する必要があります。これには、あなたが言ったようなscrapyまたはbeautifulsoupのようなものが必要です。これらはソースコードを調べて、必要な情報を選択します

あなたが何を望んでいるのか正確にはわからないので、説明するのは難しいですが、これがあなたの出発点になることを願っています

しかし、私が言ったように、おそらく基本的なpythonを学ぶべきであり、それは大いに役立つでしょう

これが役立つことを願っています!!

于 2013-05-16T03:41:14.857 に答える