2

ASPX で動的に生成されたテーブルをスクレイピングするのに問題があります。このGasPricesのようなサイトからガス価格をこすり取ろうとしています。実際のガス価格を除いて、ガス価格表のすべての情報 (住所、提出された時間など) を抽出できます。

ガス代を安くする方法はありますか?つまり、どういうわけかそれのテキスト表現を取得します。私は ASP/ASPX にあまり詳しくありませんが、現在生成されているものが最終的な HTML に表示されません。スクレイピングにはPythonを使用していますが、特定のライブラリがない限り関係ありません...

前もって感謝します。

4

1 に答える 1

4

ここでは、ページの出所(aspx)は問題ではありません。

彼らはスクレイピングの試みを積極的に阻止しようとしているようです。数字はフォントではなく、数字である背景画像を持ついくつかのdiv要素が隣り合っています。彼らは本当にこすりたくないのです。

(もちろん、あなたが本当に決心していれば、おそらくdivのクラス名を...にマップすることができます。それらは「暗号化」されていません)

リンク先ページの下部にある著作権表示に注意してください

于 2010-04-29T23:43:37.023 に答える