0

一部のサイトから製品の画像をスクラップする必要があります。javascript を使用してスクラップしています。これまでのところ、以下のように画像のスクレイピングに成功しています

var  images = document.images;

for (var i = 0; i < images.length; i++) {
    img =  images[i];

また、ドキュメントから価格をスクレイピングしたいと考えています。私はこれが可能であることを知っており、いくつかのサイトはすでにこれを行っていますが、方法はわかりません. ドキュメントテキストで「価格」文字列を一致させるようなものは可能性があるようですが、それを行う方法がわかりません。また、より良い方法もあります。ポインタはありますか?

4

1 に答える 1

1

問題のページについてどれだけ知っているかによって異なります。盲目になる場合は、常に恐ろしいものdocument.body.innerHTML.match(/£\d+\.\d+/g)(または通貨によっては同様のもの)を使用できます。いずれにせよ、ページ内のパターンを見つけて一致させ、そこから価格を取得する必要があります.

ボーナス ポイント: Google ベース フィード (保護されていない) があるかどうかを確認してください。これは (通常) 必要なすべてのものを含む XML フィードになります。

于 2012-04-19T20:22:54.843 に答える