Web サイトの HTML ページ ソースをリッピングして電子メールを取得しようとしています。リッパー/ダンパーまたはそれを呼び出したいものを実行すると、すべてのソースコードが取得されますが、160 行目で停止しますが、手動で Web ページに移動し、右クリックして [ページのソースを表示] をクリックし、テキストを解析できます。ソース コード全体は 200 行強です。手動で各ページに移動して右クリックすることの唯一の問題は、10 万ページを超えるページがあり、時間がかかることです。
ページのソースを取得するために使用しているコードは次のとおりです。
public static void main(String[] args) throws IOException, InterruptedException {
URL url = new URL("http://www.runelocus.com/forums/member.php?102786-wapetdxzdk&tab=aboutme#aboutme");
URLConnection connection = url.openConnection();
connection.setDoInput(true);
InputStream inStream = connection.getInputStream();
BufferedReader input = new BufferedReader(new InputStreamReader(
inStream));
String html = "";
String line = "";
while ((line = input.readLine()) != null)
html += line;
System.out.println(html);
}