1

これが正しいセクションかどうかはわかりません。

これまでのところ、イタリアのサッカー ニュース Web サイト ( Pianeta Lecce ) 用の HTML iPhone Web アプリケーションを作成しました。

私のウェブアプリには、トピックに応じてニュースを選択できるタブバーがあり、ウェブサイトからニュースをスクレイピングするために使用したPHP Simple Html DOM Parser ( PHP Simple HTML Dom Parser ) のおかげで、それをうまく行うことができました。

これが問題です。画像とニュースの短い要約が表示されたリンクをクリックすると、明らかにニュースの外部ページがロードされます。しかし、これは私が望むものではありません: 私が望むのは、ニュースをクリックすると、何らかの方法 で、そのニュースを参照するサイトのページから再びスクレープされたニュース コンテンツを含むページを作成する必要があることです (必要なのは写真とまさにニュース!)。

これは非常に優れた問題だと思いますが、これを達成するための最良の方法は何か、特に単純さについてはよくわかりません。

ですから、それを行うための可能な方法と、どのように行うかを提案していただきたいと思います。また、これは iPhone Web アプリケーションであることを忘れないでください。

ありがとうございました!

4

1 に答える 1

0

私は3つのステップでそれを行います:

  1. Web からコンテンツをスクレイピングする
  2. コンテンツを正規化し、DB に追加します
  3. DB から既知の形式でニュースの詳細を提供する

このように、スクレイパーによってDBに保存されている同じ要素(タイトル、ニュースの短いプレビュー、リンク)を提供しているため、アプリはスクレイピングしているサイトに依存しません。

それに加えて、スクレイピングプロセスをより適切に制御し、スクレイピングされた悪いニュースを監視することもできます.

于 2013-01-01T16:32:21.773 に答える