JAVA で JSOUP DOM パーサーを使用して、URL http://www.walmart.com/search/search-ng.do?tab_value=all&search_query=camera&search_constraint=0&Find=Find&ss=false&ic=16_32の Walmart ページを破棄しています。
ユーザーパラメータに基づいてURLを構築し、DOMオブジェクトを構築しています
Document doc = Jsoup.parse(contentVar);
次のステップでは、すべての製品/価格を印刷したいと思います。次のコードを使用しました。
String price = doc.getElementsByClass("camelPrice").text();
String title = doc.getElementsByClass("ListItemLink").text();
System.out.println("Product: " + title);
System.out.println("Price: "+ price);
ここでは、価格と製品の説明にタグを使用しています。しかし、私の結果は次のとおりです。
タイトル/商品名:C1、C2、…C16(cはカメラタイトル) 価格:$ 279.95 $ 279.95 $ 479.00 $ 479.00 $ 60.00 $ 60.00 $ 99.00 $ 99.00 $ 429.00 $ 429.00 $ 129.00 $ 129.00 $ 109.00 $ 109.00 $ 89.00 $ 89.00 $ 384.00 $ 388.00 $ 125.00 $ 125.00 $ 128.00 $ 128.00 $ 125.00 $ 128.00
ここでは、クイックビュー タグの可能性があるため、価格が重複しています。JSOUPメソッドを使用して価格の重複を取り除く方法はありますか