88

Android ではWebView、ページを表示している があります。

ページを再度リクエストせずにページ ソースを取得するにはどうすればよいですか?

文字列を返すWebView何らかのメソッドが必要なようですが、残念ながらそうではありません。getPageSource()

JavaScript を有効にした場合、コンテンツを取得するためにこの呼び出しに入れる適切な JavaScript は何ですか?

webview.loadUrl("javascript:(function() { " +  
    "document.getElementsByTagName('body')[0].style.color = 'red'; " +  
    "})()");  
4

7 に答える 7

166

これは遅い答えであることは知っていますが、同じ問題があったため、この質問を見つけました。lexandera.comのこの投稿で答えを見つけたと思います。以下のコードは、基本的にサイトからのカット アンド ペーストです。それはトリックを行うようです。

final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @JavascriptInterface
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");
于 2011-02-03T21:36:16.563 に答える
34

issue 12987 ごとに、Blundell の回答がクラッシュします (少なくとも私の 2.3 VM では)。代わりに、特別なプレフィックスを付けて console.log への呼び出しをインターセプトします。

// intercept calls to console.log
web.setWebChromeClient(new WebChromeClient() {
    public boolean onConsoleMessage(ConsoleMessage cmsg)
    {
        // check secret prefix
        if (cmsg.message().startsWith("MAGIC"))
        {
            String msg = cmsg.message().substring(5); // strip off prefix

            /* process HTML */

            return true;
        }

        return false;
    }
});

// inject the JavaScript on page load
web.setWebViewClient(new WebViewClient() {
    public void onPageFinished(WebView view, String address)
    {
        // have the page spill its guts, with a secret prefix
        view.loadUrl("javascript:console.log('MAGIC'+document.getElementsByTagName('html')[0].innerHTML);");
    }
});

web.loadUrl("http://www.google.com");
于 2011-12-24T06:33:53.557 に答える
17

これはjluckyiv のに基づいた回答ですが、次のように Javascript を変更する方が簡単で良いと思います。

browser.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");
于 2012-04-17T02:26:46.427 に答える
6

HTML を個別にフェッチしてから Web ビューにロードすることを検討しましたか?

String fetchContent(WebView view, String url) throws IOException {
    HttpClient httpClient = new DefaultHttpClient();
    HttpGet get = new HttpGet(url);
    HttpResponse response = httpClient.execute(get);
    StatusLine statusLine = response.getStatusLine();
    int statusCode = statusLine.getStatusCode();
    HttpEntity entity = response.getEntity();
    String html = EntityUtils.toString(entity); // assume html for simplicity
    view.loadDataWithBaseURL(url, html, "text/html", "utf-8", url); // todo: get mime, charset from entity
    if (statusCode != 200) {
        // handle fail
    }
    return html;
}
于 2013-10-25T01:59:33.540 に答える
4

@jluckyivの回答のコードを使用してこれを機能させることができましたが、MyJavaScriptInterfaceのprocessHTMLメソッドに@JavascriptInterfaceアノテーションを追加する必要がありました。

class MyJavaScriptInterface
{
    @SuppressWarnings("unused")
    @JavascriptInterface
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}
于 2014-06-04T16:47:27.750 に答える
1

また、targetSdkVersion が >= 17 の場合は、メソッドに @JavascriptInterface のアノテーションを付ける必要があります。これは、SDK 17 に新しいセキュリティ要件があるためです。つまり、すべての JavaScript メソッドに @JavascriptInterface のアノテーションを付ける必要があります。そうしないと、次のようなエラーが表示されます: Uncaught TypeError: Object [object Object] has no method 'processHTML' at null:1

于 2014-06-12T23:26:30.230 に答える
-1

キットカット以降で作業している場合は、chrome リモート デバッグ ツールを使用して、Web ビューに出入りするすべての要求と応答、および表示されたページの html ソース コードを見つけることができます。

https://developer.chrome.com/devtools/docs/remote-debugging

于 2016-02-23T16:08:00.120 に答える