0

HTMLファイルをダウンロードしようとしていますが、実際には約6000行のテーブルなので、このコードを書きました

 Document _DOM=Jsoup.connect(_EXACT1_URL)
            .cookies(_COOCKIES)
            .timeout(70000)
            .userAgent("Mozilla/5.0 (Windows NT 6.1; rv:19.0) Gecko/20100101 Firefox/19.0")
            .get();

Document(_DOM) を解析して行を計算しようとすると、取得できるのは 1127 行だけです ドキュメント文字列をファイル (page.html) に書き込んで解析しようとすると、同じ結果が得られます。ファイル サイズは次のとおりです。ブラウザ(Firefox)を使用してダウンロードすると約(1.2 Mb)実際のサイズは(6 Mb)ですJVMヒープサイズのメモリをこのように増やしました

java -Xms32m -Xmx500 -jar myJarFile.jar, unfortunately, get the same result.

私はあなたの助けにとても感謝しています.

4

1 に答える 1