0

Java で URL の HTTP 応答コードを見つける必要があります。これは URL と HTTPURLConnection API を使用して実行できることを知っており、thisthisなどの以前の質問を確認しました。

約2000のリンクでこれを行う必要があるため、速度が最も必要な属性であり、その中でクローラー4jを使用してすでに150〜250ページをクロールしており、このライブラリからコードを取得する方法がわかりません(そのため、これらのリンクを別のライブラリに再度接続して、応答コードを見つけます)。

4

2 に答える 2

3

In Crawler4J, the class WebCrawler has a method handlePageStatusCode, which is exactly what you are looking for and what you would also have found if you had looked for it. Override it and be happy.

于 2012-06-26T14:36:23.050 に答える
2

最初のリンクの背後にある答えには、必要なものがすべて含まれています: How to get HTTP response code for a URL in Java?

    URL url = new URL("http://google.com");
    HttpURLConnection connection = (HttpURLConnection)url.openConnection();
    connection.setRequestMethod("GET");
    connection.connect();

    int code = connection.getResponseCode();

応答コードは、サーバーから返された HTTP コードです。

于 2012-06-26T14:26:48.353 に答える