8

私はJsoup.parse()のすべての文字列バージョンを使用しています:

parse(String html, String baseUri)

パフォーマンスのベンチマークのために接続速度を除外します。

典型的なローエンドのAndroidスマートフォンでJsoup.parse()は、それほど珍しくない長いWikipediaページ(〜600KB)のhtml文字列を呼び出すのに9秒かかります。

私のクライアントはこの遅延を受け入れようとはしていません。別のエンジン用にJsoupをダンプするか、自分でWebページを解析するか(Javaのまま)、NDKでC / C ++パーサーを使用することを考えています(利用可能な場合)。

しかし、私は可能な限りJsoupを使い続けることを好みます。

スピードアップする方法はありJsoup.parse()ますか?

4

1 に答える 1

6

私が大きなページで自分でやろうとしていることは(可能で、ページ上の一部の情報だけが必要な場合)、テキストを最小化して、以前に必要な領域を識別して解析し、次にJSoupを使用して必要な領域を解析することです。

このようにして、Javaで独自の解析を組み合わせてデータを削減し、コモディティにJSoupを使用できます。

于 2012-07-14T11:04:07.433 に答える