javaで正規表現を使用してサイトからメニュー項目を取得するクローラーを作成しようとしています。ウェブサイトの URL は http://www.dinebombaygarden.com/appetizers.htmlです。
Pattern と Matcher を使用して、メニュー項目 (野菜パクポラ、オニオンまたはほうれん草、ポテト パコラなど) を取得するにはどうすればよいですか?
私のコードは次のとおりですが、うまくいきません。
public ArrayList<String> getMenuItems(String menuURL, String menuRegex) throws IOException{
ArrayList<String> items = new ArrayList<String>();
Document doc = Jsoup.connect(menuURL).post();
String text = doc.body().text();
System.out.println(text);
Pattern pattern = Pattern.compile(menuRegex);
Matcher matcher = pattern.matcher(text);
while(matcher.find()){
items.add(matcher.group());
}
return items;
}
String menuURL = "http://www.dinebombaygarden.com/appetizers.html";
String menuRegex = "[A-Z][a-z]+.{10,50}[$]\\s[\\d.]+.95";
ここの menuRegex はうまく機能していません。誰でもこの問題を解決できますか?
どうもありがとうございました。