0

Jスープを使用しています。私はdocument= connect.get(); HTMLページを取得して取得します。

今私はそれをテキスト(文字列)に書きます。

これらのページにデータを入力するユーザーがいます。私は各ユーザー名を知っています。これらのページにはユーザー名があります。string.contains("username") を実行して、ユーザーが存在するかどうかを確認できます。

今私の問題は次のとおりです。そこに名前のあるユーザーがいます

テーブル

番号付きリスト

順不同リスト

体内

ただし、これらすべての場合で、形式は次のとおりです。例

<li><a href="http://university.xxx.students.com/grade9/john/117429">2012 academic record</a></li>

一部はテーブルにあり、すべて..

この例では、生徒の名前 = john を知っています。すべての URL を取得するにはどうすればよいですか?

==

4

2 に答える 2

1

これには正規表現を使用できます。

Elements elements = document.select("[href~=(?is)http://university\\.xxx\\.students\\.com/grade9/(.+?)/[0-9]+?]")

より抽象的な:document.select("a[href~=regex]")

置換できる名前が既にわかっている場合は(.+?)、例:

Elements elements = document.select("[href~=(?is)http://university\\.xxx\\.students\\.com/grade9/" + name + "/[0-9]+?]")

于 2012-09-05T10:43:49.183 に答える
0

これはどう:

    Document doc = Jsoup.connect(url).get();
    Elements links = doc.select("a[href]");

    for (Element link : links) {
        if(link.attr("abs:href").contains(studentName) || link.text().contains(studentName)){
            studentLinkList.add(link.attr("abs:href"));
        }
    }
于 2012-09-05T12:37:43.293 に答える