tempobet.com のデータを英語形式で解析しようとしています。問題は、Google レスト クライアントを使用すると、必要に応じて HTML が返されることですが、Jsoup を介して解析しようとすると、ロケール形式で日付形式が返されます。これはテストコードです
import java.io.IOException;
import java.util.Date;
import java.util.ListIterator;
import java.util.Locale;
import org.apache.commons.lang3.time.DateUtils;
import org.jsoup.Connection.Response;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;
public class ParseHtmlTest {
@Test
public void testName() throws IOException {
Response response = Jsoup.connect("https://www.tempobet.com/league191_5_0.html")
.userAgent("Mozilla/5.0 (Windows NT 6.2; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1667.0 Safari/537.36")
.execute();
Document doc = Jsoup.connect("https://www.tempobet.com/league191_5_0.html")
.userAgent("Mozilla/5.0 (Windows NT 6.2; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1667.0 Safari/537.36")
.header("Accept-Language", "en-US")
.header("Accept-Encoding", "gzip,deflate,sdch")
.cookies(response.cookies())
.get();
Elements tableElement = doc.select("table[class=table-a]");
ListIterator<Element> trElementIterator = tableElement.select("tr:gt(2)").listIterator();
while (trElementIterator.hasNext()) {
ListIterator<Element> tdElementIterator = trElementIterator.next().select("td").listIterator();
while (tdElementIterator.hasNext()) {
System.out.println(tdElementIterator.next());
}
}
}
}
ここに応答の例があります
<td width="40" class="grey">21 Nis 20:00</td>
日付はどちらである必要があります"21 Apr 20:00"。どんな助けにも感謝します。とにかくありがとう