0

私のアプリでは、いくつかのWebページのURLがあり、htmlタグを識別して、そのURL(そのhtmlページ)から特定の部分/部分のみを取得したいと考えています。

たとえば、<div id="content"> to </div>htmlソースコードに従って部分を取得したいと思います。別のファイルに保存できるようにします。

たとえば、私のURLは

1) http://www.makepartsfast.com/2012/09/4337/more-3d-printing-in-metals-ex-one-introduces-the-m-flex-3d-printing-system/

2) http://www.windpowerengineering.com/policy/new-study-shows-the-benefits-of-wind-energy-in-kansas/

3) http://www.windpowerengineering.com/design/mechanical/bearings/podcast-for-windtech-2012-generator-maintenance/

これらのURLはすべて、記事のhtmlページを開きます。ただし、HTMLページのメインコンテンツのみを表示したいと思います。

また、一部のURLについてのみ、次のコードで成功しました。

私のコード:

NSString *originalString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.windpowerengineering.com/uncategorized/how-superfinishing-boosts-component-reliability/"] encoding:NSUTF8StringEncoding error:nil];

NSScanner *scanner = [NSScanner scannerWithString:originalString];
    NSString *extractedString = nil;


    [scanner scanUpToString:@"<div id=\"content\">" intoString:nil];
    [scanner scanString:@"<div id=\"content\">" intoString:nil];



    [scanner scanUpToString:@"<div style=\"clear:both;\">" intoString:&extractedString];


    if (extractedString) 
    {
        // string was extracted
        NSLog(@"%@", extractedString);
    }   

ただし、異なるページに複数の <div style=\"clear:both;\">タグが含まれる場合があります。したがって、メソッドがそのタグに遭遇すると、そのタグまでのコンテンツのみが表示されます。

提案今、私はすべての<div>タグを数え、そのHTMLページからすべてのメインコンテンツを取得しようと考えていますが、これを行うのは混乱しています。

どうすればいいですか?

助けて!!

ありがとう..

4

1 に答える 1

0

AFFeedParsingメソッドを使用しました。すべての記事がフィードだからです。サンプルコードは

  1. cocoacontrols
于 2012-12-25T06:53:39.550 に答える