特定のタグの下にあるWebページのすべての画像を抽出する方法を知りたいです。たとえば、以下の場合:
<div class="img-style">
<img src="http://blah.../x.jpg">
その特定のdivクラスの下にあるすべての画像をJAVAを使用して抽出したいと思います。それは可能ですか、どんな助けもいただければ幸いです
特定のタグの下にあるWebページのすべての画像を抽出する方法を知りたいです。たとえば、以下の場合:
<div class="img-style">
<img src="http://blah.../x.jpg">
その特定のdivクラスの下にあるすべての画像をJAVAを使用して抽出したいと思います。それは可能ですか、どんな助けもいただければ幸いです
私はインターネットをスクレイピングするためのこのライブラリが大好きですhttp://jsoup.org/。私はパーサーを約30分で稼働させ、空き時間にJavaを作成してから3か月しか経っていません。
Java用の他の優れたHTMLスクレイピングライブラリは次のとおりです:TagSoup、HTMLUnit、Web-Harvest。ライブラリを使用すると、独自のライブラリを最初から作成するよりもはるかに迅速かつ簡単になります。次回はあなたが試した/見たいくつかの方法を提供します