1

これは本当に挑戦的なものだと思います!

私は自分の地元のサッカー リーグ www.rdyfl.co.uk のウェブサイトを作成し、FA のフルタイム システムからの JavaScript コード スニペットを含めて、私たちのフィクスチャを生成し、表フィクスチャの最近の結果などにリンクします。

サイトに追加したい別の機能については、年齢層と部門ごとに「今後の試合」をスクレイピングする必要がありますが、ソースを調べると 2 つの問題があります。

  1. フィクスチャのコンテンツは JavaScript によって生成されるため、ソースだけでなく、生成されたソースも表示する必要があります。

  2. Firefox を使用して生成されたソースを表示すると、チーム名は実際にはさらに JavaScript のリンクであり、名前自体ではありません。

私は基本的に、定期的にフィクスチャをダウンロードしてからmysqlデータベースに書き込みたいですか?

FA に問い合わせましたが、データにアクセスするためのオプションはありませんか?

これまでスクレイピングのコーディングをしたことがないので、誰かが私に簡単な解決策を教えてくれますか、それとも挑戦に夢中ですか?

4

3 に答える 3

0

OutWit Hubの最新バージョンは、動的コンテンツで非常にうまく機能しています。リンク、画像、文書、表、およびテキストを抽出するために outwit によってスクレイピングされたソースは、更新された DOM です。これらを使用して、必要なものをつかむための仕事を確実に作成できます。カスタム スクレイパーはバージョン 1.0.3 でも静的ソースに適用されますが、バージョン 1.1.x (まだベータ版) では、静的ソースと動的に変更された DOM のどちらかを選択できます。

于 2011-03-06T09:51:41.303 に答える
-1

Javascript によって作成されたコンテンツを破棄することは困難です。私の知る限り、AJAXでこれを行う必要があります。コンテンツには、jQuery または少なくともいくつかの ID で取得できる css が含まれていることを願っています。取得できるIDまたはクラスはありますか?

于 2011-03-05T21:30:00.037 に答える