1

このページのhtmlソースhttp://www.fxstreet.com/rates-charts/currency-rates/を抽出しようとしています。

Chromeからページを.htmlファイルとして保存したときに表示されるものが必要です。

私はこれをJavaで、bufferedreaderを使用して、次にjsoupを使用して実行しようとしました。私もPythonでそれをやろうとしましたが、次のメッセージが表示され続けます。

「このサイトでは、JavaScriptとCookieを有効にする必要があります。ブラウザの設定を変更するか、ブラウザをアップグレードしてください。」

最終的な目標は、メインテーブルの値を抽出することです。

4

2 に答える 2

4

HtmlUnitを使用して設定してみてくださいsetJavascriptEnabled(true)

これも見てください:これこれ

JSoupはJavascriptを実行するためのヘッドレスブラウザではないため、ページを取得するには他のライブラリを選択する必要があります。その後、JSoupを使用してページを解析できます。

于 2012-06-01T21:51:22.467 に答える
1

メインテーブルを抽出するだけで、Jsoupを使用して簡単に実行できます

これは、ページのメインテーブルからすべてのコンテンツを取得するメソッドです。

public void parse(){
        try{

        Document doc = Jsoup.connect("http://www.fxstreet.com/rates-charts/currency-rates/").get();
        Element content = doc.getElementById("ddlPairsChoose");
        Elements table = doc.getElementsByClass("applet-content");      

        System.out.print(table);

        }

        catch(Exception e){

            System.out.print("error --> " + e);
        }       
    }

ページに表を印刷します

于 2012-12-09T15:56:57.243 に答える