android - Android での HTML 解析

Question

HTML を解析する方法を学ぼうとしていますが、Java や Android の経験があまりないため、少し複雑です。IBM XML 解析チュートリアルを読み、RSS フィードを解析する方法を学びました。私の問題は、HTML サイトからデータを取得したいということです。HTML クリーナー、JSON などに関する情報をいくつか読みましたが、役立つチュートリアルが見つかりません。役立つチュートリアルはありますか？

ありがとう。

score 0 · Accepted Answer

IMOHTMLを解析する簡単な方法は2つあります。

ライブラリ（HTMLTidyなど）を使用してHMLをXML（XHTML）に変換してから、XMLパーサーを使用します
既存のHTMLパーサー（たとえば、WebKit、ForeFox、IEなどの標準のWebブラウザー）を使用してから、解析されたHTMLのAPIに適した表現である「DOM」を読み取ります。

または、独自のパーサーを作成する場合（宿題の場合は、そうすべきではないと思います。適切に/完全に実装するには時間がかかり、複雑になります）、HTMLの解析の仕様を参照してください。

score 0 · Accepted Answer

次の HTML パーサーを確認してください。そこにはもっとあります。たぶん、あなたのために働くでしょう：

HTMLCleaner: http://htmlcleaner.sourceforge.net/
タグスープ: http://ccil.org/~cowan/XML/tagsoup/
ジェリコ: http://jericho.htmlparser.net/docs/index.html

android - Android での HTML 解析

2 に答える 2

Related

Reference