0

月刊誌を表示するアプリの作成を検討しています。ジャーナルのXMLはなく、PDFのタイトルヘッダーとURLを毎月変更するだけです。これは常にソースコードの同じ場所に保存されているので、私は内のすべてのテキストを見つけることを検討しています

div class = entry clearfix post / div

タグを付けてから、最初のURLを抽出します。私は以前にXMLの解析に取り組んだことがありますが、HTMLはありません。これに対する私の最善の選択肢は何でしょうか?

アップデート:

ソースコードのある時点でのみ、ページに「」と表示されますTo Download the PDF, click here。そこで、次のスキャナーを設定しました。

NSURL *url = [NSURL URLWithString:@"http://www.thejenkinsinstitute.com/Journal/"];
NSString *content = [NSString stringWithContentsOfURL:url];
NSString * aString = content;
NSMutableArray *substrings = [NSMutableArray new];
NSScanner *scanner = [NSScanner scannerWithString:aString];
[scanner scanUpToString:@"<p>To Download the PDF, <a href=\"http://michaelwhitworth.com/wp-content/HE22.pdf\">" intoString:nil]; // Scan all characters before #
while(![scanner isAtEnd]) {
    NSString *substring = nil;
    [scanner scanString:@"<p>To Download the PDF, <a href=\"" intoString:nil]; // Scan the # character
    if([scanner scanUpToString:@"\"" intoString:&substring]) {
        // If the space immediately followed the #, this will be skipped
        [substrings addObject:substring];
    }
    [scanner scanUpToString:@"#" intoString:nil]; // Scan all characters before next #
}
NSLog(@"Here is the Substring%@", substrings);
// do something with substrings
[substrings release];

コンソールでは、最初に返されるのはPDFのURLですが、それ以上のものが含まれています。これが簡単な抜粋です。

"2012-11-23 15:33:36.383 Jenkins[8306:c07] Here is the Substring( "http://michaelwhitworth.com/wp-content/HE22.pdf", "#8220;As the Bible School Goes So Goes the Congregation&#8221; by Ira North</a></p>\n<p style=","

これでURLだけが表示されないようにするために、何が間違っているのでしょうか。

4

1 に答える 1

0

私は似たようなことをしました。小さなWebサービス(基本的には必要なHTMLを破棄してREST方式で返す単純なRubyアプリであるAPIです。Webサービス/APIはどちらかといえば良い考えです。 HTMLの変更(idの要素の変更など)では、解析しているノードのパスを変更するためにiOSアプリを更新する必要はありません。

于 2012-11-23T21:23:46.793 に答える