0

現在、xpath クエリを使用して html サイトから特定のデータを取得しようとしていますが、特定の部分を取得するのに問題があります。

//div[@id='main']/h2私のxpathクエリとして使用すると、次を使用して「View Current」テキストを取得できます。

exampleSite.title = [[element firstChild] content];

ただし、次のことも取り入れたいと思います。

1. <b>5/9/2013<nbsp><nbsp> 10:58:45 PM</b>
2. <b>6.32</b>
3. <b>5  Total Points</b>
4. <b>3.72</b>

これまでのところ、私はこれを持っています://div[@id='main']/table[@class='bodytext']/trしかし、それは私が立ち往生するところです. どんな助けでも大歓迎です!ありがとうございました!

スクレイピングしようとしているhtmlは次のとおりです。

<div id="main">
<h2>View Current</h2>

      <table width="96%" border="0" cellpadding="4" cellspacing="0" bordercolor="#eeeeee" align="center" height="276" valign="top" class="bodytext">
        <tr valign="top" >
          <td colspan = 2 height="13" valign="top" align="left" width="54%" class="headerblue" >Balances <br>
          </td>
        </tr>
        <tr valign="top" > 
          <td colspan = 2 height="13" valign="top" align="left" width="54%" class="text" >Balances 
            as of: <b>5/9/2013<nbsp><nbsp> 10:58:45 PM</b></td>
        </tr>
        <tr valign="top" > 
          <td colspan = 2 height="13" valign="top" align="left" width="46%" class="text" >Account 
            Number: <b>101010123</b></td>
        </tr>
        <tr valign="top" > 
          <td colspan = 2 height="13" valign="top" align="left" width="46%" class="text" ></td>
        </tr>

        <tr valign="top" > 
          <td height="13" valign="top" align="left" width="46%" class="text" >Example Card Amount: 
            <b>6.32</b></td>
<td height="13" valign="top" align="left" width="46%" class="text" ><a href="balance.asp?">View Details</a></td>
        </tr>

        <tr valign="top" > 
          <td height="13" valign="top" align="left" width="46%" class="text" >Example Dining Plans:<b>5  Total Points</b>

</td>
<td height="13" valign="top" align="left" width="46%" class="text" ><a href="balance2.asp?">View Details</a></td>
        </tr>

        <tr valign="top" > 
          <td height="13" valign="top" align="left" width="46%" class="text" >Credit For Printing: 
            <b>3.72</b></td>
<td height="13" valign="top" align="left" width="46%" class="text" ><a href="balance1.asp?">View Details</a></td>
        </tr>

          <td colspan = 2 height="13" valign="top" align="CENTER"  class="text">For 
            questions contact Cashiers at<BR> (000)000-0011 or <a href="mailto:example@example.com">example@example.com</a></td>
        </tr>
        <tr valign="top"> 
          <td colspan = 2 height="13" valign="top" align="CENTER"  class="text" > 

<a href="balance1.asp">All Plan Usage for last 90 days is available here</a>
            </td>
        </tr>
        <tr valign="top"> 
          <td colspan = 2 height="13" valign="top" align="CENTER"  class="text" > 

<a href="balance.asp?pln=Full">All Usage for last 365 days is available here</a>
            </td>
        </tr>

      </table>



</div>
4

2 に答える 2

2

//div[@id='main']/table[@class='bodytext']/tr/td/b<b>テーブルセル内のすべての のリストが表示されます。

于 2013-05-10T10:34:38.817 に答える
1

Mennny の回答を拡張したものを次に示します。これは実際には正しいので、それを受け入れる必要があります。コメントであなたの追加の質問に答えようとします:

あなたは次のように解析を行います: (htmlDataは私のデモデータです)

NSData *htmlData = [NSData dataWithContentsOfFile:[@"/Users/dennis/Desktop/demo.html" stringByStandardizingPath]];
TFHpple *parser = [[TFHpple alloc] initWithHTMLData:htmlData];
NSArray *bTags = [parser searchWithXPathQuery:@"//div[@id='main']/table[@class='bodytext']/tr/td/b"];

その後、解析され<b>たタグの内容をNSMutableArray.

NSMutableArray *stringsInBTag = [[NSMutableArray alloc] initWithCapacity:0];
for (TFHppleElement *element in bTags) {
    [stringsInBTag addObject:element.content];
}

そこに得られるものは次のとおりです:(配列のログ出力)

( "5/9/2013", 101010123, "6.32", "5 合計ポイント", "3.72" )

次に、ラベルを設定します。

// Set label 1 to third <b>
self.label1.text = stringsInBTag[2];

// Set label 2 to first <b> 
self.label2.text = stringsInBTag[0];
于 2013-05-10T11:49:27.607 に答える