-1

私はjsoupを使用して HTML ページを解析します。それを使用する場合は、すべての要素を含むdoc.select("tr")リストを返す必要があります。<tr>そのリストのサイズを調べると、242 であることがわかります。ただし、Chrome を使用して単純な検索でソースを再確認すると、264 ヒットしました。

これにより、コードが壊れます。jsoup は多くの要素をうまく処理できないようです。

テーブル、262 * 88 セル、およびほぼ同じ数のヘルパー タグを含むページを解析しています。これが jsoup がリストにオブジェクトを持っていない理由ですか? または、なぜ私がこの問題を抱えていると思いますか?

4

1 に答える 1

0

サイトによって違いがあるかもしれません。デスクトップ ブラウザーを使用している場合、モバイル デバイスなどとは異なるビューが表示されることがよくあります。

jsoupでこれを試すことができます:

  1. ブラウザのユーザーエージェントを設定する
  2. 解析されたドキュメント ( System.out.println(doc)) を印刷し、すべてのタグが含まれているかどうかを確認します
  3. 別のブラウザでウェブサイトを確認する
  4. 追加の html を作成する JavaScript (または同様のもの) がないかどうかを確認します (jsoup はそれらを処理できません)。
于 2013-07-30T09:26:51.553 に答える