私は現在、HTMLを解析するためにJsoupを使用しています。コードは非常に単純です。
Document doc = null;
try{
doc = Jsoup.connect(link).get();
}
catch (Exception e) {
//System.out.println("Some error occured.");
textView.setText(e.getMessage());
}
必要なWebページが得られ、後でgetElementsByTagメソッドなどを使用して、そのWebページから必要なデータを抽出できます。ただし、Web ページの一部のみを使用したい。たとえば、< ! の後にすべてを破棄したい。-- / foo --> 私のウェブページで。(実際には < と ! の間に空白はありませんが、ここでは入力できません。) その文字列の後に Web ページを破棄し、必要な部分だけを含む新しいドキュメントを取得する方法はありますか? クックブックを確認しましたが、ウェブページの構造のみを処理しているように見えるため、文字列の削除などを行っても問題ないかどうかはわかりません。お読みいただきありがとうございます。