0

私は次の解決策を試しました:

  1. Jsoupを使用してhtmlから段落のテキストを抽出するには?
  2. jsoup このテキストを抽出する方法

しかし、どちらの例もタグからのテキストを扱っています。

私のhtml Web検索には、このユニークなコードがあります。

ここに画像の説明を入力

必要なのは、d.href変数に付属するリンクを取得することです。

次のようなコードを試しました:

  Elements link = jSoupConnection.select(":contains(d.href)");  
  Elements link = jSoupConnection.select("#d.href");
  Elements link = jSoupConnection.getElementsByAttributeValueContaining("d.href","google");

しかし、今までどれも機能しませんでした。

また、 http://jsoup.org/cookbook/で 1 つの調査を試みましたが、何も成功しませんでした。Jsoupの経験が豊富な人が私を助けてくれませんか?? 前もって感謝します

4

1 に答える 1

0

Jsoup select 要素で特定できるタグがテキストに含まれていない場合は、ホール ページをダウンロードし (これは で実行できますElements link = jSoupConnection.select("*");)、アプリケーションで 1 つのテキスト ファイルとして開いて、必要なものを取得する必要があります。欲しいです。ダウンロードしたファイルが大きすぎて、それが私の問題だった場合は、ダウンロードするファイル サイズを制限してみてください。これらのリンクで詳細を確認できます。

  1. Java を使用したファイル サイズの作成の制限
  2. Javaでファイルサイズを制限する方法
于 2013-07-20T19:31:03.627 に答える