1

HTML を解析する方法を学ぼうとしていますが、Java や Android の経験があまりないため、少し複雑です。IBM XML 解析チュートリアルを読み、RSS フィードを解析する方法を学びました。私の問題は、HTML サイトからデータを取得したいということです。HTML クリーナー、JSON などに関する情報をいくつか読みましたが、役立つチュートリアルが見つかりません。役立つチュートリアルはありますか?

ありがとう。

4

2 に答える 2

0

IMOHTMLを解析する簡単な方法は2つあります。

  • ライブラリ(HTMLTidyなど)を使用してHMLをXML(XHTML)に変換してから、XMLパーサーを使用します
  • 既存のHTMLパーサー(たとえば、WebKit、ForeFox、IEなどの標準のWebブラウザー)を使用してから、解析されたHTMLのAPIに適した表現である「DOM」を読み取ります。

または、独自のパーサーを作成する場合(宿題の場合は、そうすべきではないと思います。適切に/完全に実装するには時間がかかり、複雑になります)、HTMLの解析の仕様を参照してください。

于 2011-01-28T18:11:53.727 に答える
0

次の HTML パーサーを確認してください。そこにはもっとあります。たぶん、あなたのために働くでしょう:

于 2011-01-28T19:10:58.570 に答える