GET を実行した後にページ内のすべてのリンクを取得したいのですが、私のコードは一部の Web サイトでは機能しますが、他の Web サイトでは機能しません。
Pattern linkPattern = Pattern.compile("<a[^>]+href=[\"']?([\"'>]+)[\"']?[^>]*>(.+?)",
Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
Matcher pageMatcher = linkPattern.matcher(Content);
if (FindKeyword(Content)) {
LinksWithKey.add(HostName);
}
count++;
while (pageMatcher.find()) {