java - jsoup 巨大な html ダウンロード

翻译自：https://stackoverflow.com/questions/15613536 2013-03-25T11:14:34.263

1104 次

HTMLファイルをダウンロードしようとしていますが、実際には約6000行のテーブルなので、このコードを書きました

 Document _DOM=Jsoup.connect(_EXACT1_URL)
            .cookies(_COOCKIES)
            .timeout(70000)
            .userAgent("Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 Firefox/19.0")
            .get();

Document(_DOM) を解析して行を計算しようとすると、取得できるのは 1127 行だけですドキュメント文字列をファイル (page.html) に書き込んで解析しようとすると、同じ結果が得られます。ファイルサイズは次のとおりです。ブラウザ（Firefox）を使用してダウンロードすると約（1.2 Mb）実際のサイズは（6 Mb）ですJVMヒープサイズのメモリをこのように増やしました

java -Xms32m -Xmx500 -jar myJarFile.jar, unfortunately, get the same result.

私はあなたの助けにとても感謝しています.

java - jsoup 巨大な html ダウンロード

1 に答える 1

Related

Reference