私のアプリでは、いくつかのWebページのURLがあり、htmlタグを識別して、そのURL(そのhtmlページ)から特定の部分/部分のみを取得したいと考えています。
たとえば、<div id="content"> to </div>
htmlソースコードに従って部分を取得したいと思います。別のファイルに保存できるようにします。
たとえば、私のURLは
2) http://www.windpowerengineering.com/policy/new-study-shows-the-benefits-of-wind-energy-in-kansas/
これらのURLはすべて、記事のhtmlページを開きます。ただし、HTMLページのメインコンテンツのみを表示したいと思います。
また、一部のURLについてのみ、次のコードで成功しました。
私のコード:
NSString *originalString = [NSString stringWithContentsOfURL:[NSURL URLWithString:@"http://www.windpowerengineering.com/uncategorized/how-superfinishing-boosts-component-reliability/"] encoding:NSUTF8StringEncoding error:nil];
NSScanner *scanner = [NSScanner scannerWithString:originalString];
NSString *extractedString = nil;
[scanner scanUpToString:@"<div id=\"content\">" intoString:nil];
[scanner scanString:@"<div id=\"content\">" intoString:nil];
[scanner scanUpToString:@"<div style=\"clear:both;\">" intoString:&extractedString];
if (extractedString)
{
// string was extracted
NSLog(@"%@", extractedString);
}
ただし、異なるページに複数の <div style=\"clear:both;\">
タグが含まれる場合があります。したがって、メソッドがそのタグに遭遇すると、そのタグまでのコンテンツのみが表示されます。
提案今、私はすべての<div>
タグを数え、そのHTMLページからすべてのメインコンテンツを取得しようと考えていますが、これを行うのは混乱しています。
どうすればいいですか?
助けて!!
ありがとう..