0

私は主にサードパーティのWebサイトにログインし、HTMLデータを解析して日付や時刻などの特定の情報を取得するiPhoneアプリを開発しています。

ただし、WebサイトがHTMLテンプレートを少しでも更新すると、これは明らかに簡単に壊れます。

私はアプリが壊れたくないし、壊れたとしても-毎回アップルにアップデートを送りたくない。

アプリが自分のサーバーからWebサイトの解析方法に関する「指示」をダウンロードするための簡単でスマートな方法が必要です。そうすれば、HTMLが変更された場合。まったく新しいアプリのアップデートをアップルに送信する代わりに、サーバー上の指示を更新するだけです。

私は現在、XPathを使用して、ライブラリTFHppleを使用してデータを検索していますが、ObjectivecのTFHppleElementsの子に到達することもできます。

4

3 に答える 3

1

正直なところ、より賢明な方法は、おそらくサーバーに Web サイトの解析方法に関する「指示」を送信させるだけでなく、サーバーにスクレイピング全体を実行させ、「ミドルウェア」として機能させることです。サーバーは Web スクレイピングを実行し、コンテンツを JSON/XML などに変換し、デバイスはそれを要求できます。Web サイトが変更された場合は、サーバーを更新するだけで済み、解析をデバイスからサーバーにオフロードできます (スクレイピングするコンテンツによっては、スクレイピングするサイトの負荷を大幅に削減できます)。

于 2013-03-01T09:53:59.740 に答える
0

あなたはこのウェブサイトで指示を見ることができます:

最高のXMLParserがあなたのiPhoneプロジェクトに注ぐ

于 2013-03-01T10:28:03.757 に答える
0

HTML の解析

HTML を含む Web サイトを解析するコードがいかに優れているかというと、常に更新する必要があります。そして、たとえあなたがウェブサイトを使いこなせたとしても。HTML を含む Web サイトをどのように解析するかという問題が発生します。

おそらく、NSRegularExpression、NSPredicate などを使用して使用するでしょう。

ここでの大きな議論:正規表現を使用して HTML を解析しない

于 2013-03-01T10:01:23.587 に答える