このメッセージを再投稿します。順序付けられていないリストを抽出しようとしています。前の質問では、fomratが正しくありません。データを抽出しようとしているこのWebサイトは、正しくフォーマットされています。
<ul>
<li>
<i>
<a class="mw-redirect" title="title1" href="yahoo.com">used to be a best email</a>
</i>
(1999)
</li>
<li>
<i>
<a title="title2" href="google.com">Best search enginee We Will Go</a>
</i>
(1999)
</li>
<li>
<i>
<a title="title3" href="apple.com">Best Phone</a>
</i>
(1990)
</li>
</ul>
印刷したい:
title1
Google COM
yahoo.com
=以前は最高のメールでした最高の検索メールはBestphoneになります
同様にすべてのHref。
JSOUPのドキュメントを見ました。
関連する質問: jsoupは、順序付けされていないリストのデータを取得しますが、 形式の問題があります。
提案どおりに試しましたが、機能しません
私は試した:
Document doc = Jsoup.connect(url).get();
Element link = doc.select("a").last();
String title1 = link.attr("title");
問題は、これがいくつかの情報を含む大きなページであるということです。順序付けされていないリストがたくさんあるという点で。