Javaで次のように、正当な接続を構築することにより、Webサイトからソースを読み取っています。
final Socket sock = new Socket(hostname, 80);
PrintWriter writer = new PrintWriter(sock.getOutputStream(), true);
writer.println("GET /path HTTP/1.1");
writer.println("Host: " + hostname);
writer.println();
//...
while (!sock.isClosed() && (line = reader.readLine()) != null) {
System.out.println(line);
}
出力に奇妙な行がいくつかあることを除いて、うまく機能しますが、FirefoxなどでWebサイトを閲覧するとそこにはありません。
問題は、ソースの一部の行がランダムに異なる情報のために中断されることであり、なぜそのような情報を取得してソースを台無しにするのかわかりません。
<div clas
16d0
s="span5">
また
<td style="text-align:c
2000
enter; vertical-align:middle">information</td>
これは何ですか?どうすれば修正できますか?