JavaのWebページから情報を取得する簡単な方法を知っている人はいますか?たとえば、次のようなページを見ている場合:http ://www.ncbi.nlm.nih.gov/pubmed/?term= 10952317「MeSHTerms」という見出しの下にある単語のリストを抽出したい、どうすればそうできますか?
ソースを読み取ることができるものがありますが、HTMLタグなどでいっぱいです...
どんな助けでも大歓迎です!
ここで何度も言及されているように、Java用のHTML解析ライブラリであるJSoupを見てください。または、独自に作成します(推奨されません)。
おそらくTagSoupはあなたのためです。