1

次の html ソースを UIWebView にロードしました text1 text2 text2 text3 text3 text3 を
抽出したい


<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <title>1322170516271</title>
    <meta name="viewport" content="initial-scale=1.0, user-scalable=1, minimum-scale=1.0, maximum-scale=4.0">                   

    <style type="text/css">
    body
    {
        padding: 5px;
        margin: 0px;
        font-family: Helvetica, Arial;
        font-size: 12pt;
        background-color: #efefef;
        background-image: url(ArticleBackground.jpg);
        background-position: cover;
        color: #000000;
    }
    h1
    {
        text-align: center;
        border-bottom: 1px dotted #805050;
        font-size: 28px;
        line-height: 38px;
        margin-bottom: 30px;
        text-shadow: 0 2px 1px white;
        color: #803030;
    }
    </style>

</head>

<body>

    <script type="text/javascript">
    function printMe()
    {
        print();
    }
    </script>

    <div style='align:center; padding: 20px;'>

        <div>

    <b>text1</b><br><br>

    <h2>
      text2 text2
    </h2>
    <br>
    text3 text3 text3

        </div>

    </div>

</body>
</html>

しかし、これが私が使用したときに得られるものです

[webView stringByEvaluatingJavaScriptFromString:@"document.documentElement.textContent"]

body と h1 は必要ありません。ユーザーが直面している実際のテキストのみが必要です。

234534546



    body
{
    padding: 5px;
    margin: 0px;
    font-family: Helvetica, Arial;
    font-size: 12pt;
    background-color: #efefef;
    background-image: url(ArticleBackground.jpg);
    background-position: cover;
    color: #000000;
}
h1
{
    text-align: center;
    border-bottom: 1px dotted #805050;
    font-size: 28px;
    line-height: 38px;
    margin-bottom: 30px;
    text-shadow: 0 2px 1px white;
    color: #803030;
}







    function printMe()
    {
        print();
    }






text1


  text2 text2


text3 text3 text3

洞察をありがとう。

アップデート

[webView stringByEvaluatingJavaScriptFromString:@"document.body.innerHTML"] 私の目標でも機能しません

<script type="text/javascript">
    function printMe()
    {
        print();
    }
    </script>

    <div style="align:center; padding: 20px;">

        <div>

    <b>text1</b><br><br>

    <h2>
       text2 text2
    </h2>
    <br>
    text3 text3 text3

        </div>

    </div>

更新: これは既存のプロジェクトに必要です。再設計する機会があれば、解決策は簡単に見つかります。しかし、この HTML ソースがそのままだと、少し難しくなるかもしれません。

4

2 に答える 2

1

使用してみてください:

document.body.innerHTML

または、HTMLの解析を見てください。iPhoneでのHTMLの解析 SOには他にも多くのリンクがあります。

于 2012-06-13T06:35:56.983 に答える
1

すべてのテキストを div、p などの異なるタグに入れてはいけません。それらのそれぞれにIDを与えてから、構文によってそれらの中のテキストを取得します

var text1 = document.getElementById("your ID").innerHTML

これがあなたの問題でうまくいくことを願っています。

于 2012-06-13T07:21:58.023 に答える