0

現在、webview の html コンテンツから選択的な見出しをインポートしようとしています。私はjsonの解析やハックなど、さまざまなオプションを検討しています。誰かがこれを経験したことがあるか、またはこれについての簡単なアイデアを持っているかどうか疑問に思っていましたか? これが私の例です: これは私のhtmlファイルの内容です:

<div><h1><span class = "headline"> Some depressing title </span> <span class = "source" > ABCD </span> </h1> <br/> <span class = "body"> crappy body content which I do not need </span></div>

私は自分のウェブビューでこのhtmlから「見出し」と「ソース」を取得したいだけで、他には何もありません(本文ではありません)。これらを取得するパラメータを定義するにはどうすればよいですか? それを行う方法の手がかりはありますか?

ありがとう!

4

1 に答える 1

0

ステップ 1: WebView から HTML ソースを取得します -この質問を参照してください。基本的に、HTML ソースを Java String に抽出する JS インターフェースを作成します。

ステップ 2: HTML パーサー ( JSOUP など) を使用して、JAVA 文字列を簡単に処理できる形式に解析します。

ステップ 3: パーサーを使用して関連情報を抽出します。ここでは、getElementsByTag('span')すべてのスパンを取得してから、クラスでフィルタリングするために使用できます。getElementsByClass('healine')または、 andを直接使用することもできますgetElementsByClass('source')

一般に、HTML ソースを取得して、すべての場合に DOM を解析できます。

編集: パーサーを使用したくない場合は、HTML ソース文字列の検索を使用して情報を抽出できます (正しいクラスを見つけてから、「<」と「>」の文字のインデックスを見つけて情報を解析します。この方法は難しく、効率も柔軟性も劣りますが、可能です。

于 2015-04-30T15:02:09.500 に答える