0

サッカー統計の Web サイトの結果を解析して、データベースを構築しようとしています。

私はjsoupライブラリを使用しています.昨日別のユーザーが私のために書いたこのコードがあります.

私が解析しようとしているページはこれです: goalnow

そして私はこのコードを使用しています:

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;

public class HTMLParser {

public static void main(String[] args) throws IOException{
 String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

Elements stats = document.select("#Table3 tbody tr ");

for(int i = 0; i < stats.size(); i++){
    System.out.println(stats.get(i).text());
}

  }
}

出力ですべてのテーブルを探していますが、これは次のとおりです。

番号 日付 ホーム スコア アウェイ ハンディキャップ オーバー/アンダー データ FT HT FT HT

基本的には1列目。コードの何が問題になっていますか? この種のデータを解析する方法を理解するのを手伝ってくれる人はいますか?

4

1 に答える 1

0

コードは問題ありません。問題は、Web サイトのコンテンツにJavaScriptが使用されていることです。残念ながら、JSoup は JS をサポートしていません。

最初の行は一般的な Html であるため、解析されます。ところで。Jsoup が Web サイトをどのように認識しているかを確認することは常に役に立ちます。

String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

System.out.println(document);

しかし、ここで私の答えを見ることができます: javascript によって隠された html を解析しようとしています

そこで、役立つ JavaScript ライブラリをいくつかリストしました。

于 2013-05-29T17:35:21.777 に答える