Web サイトを検索してコンバージョン率を抽出する必要がある課題に取り組んでいます。
レートを単純に一致させることができれば、これをキャプチャして抽出するのは簡単ですが、更新ボタンを押してプログラムに更新されたコンバージョン率を検索させる必要があるため、単にハードコーディングすることはできません検索する一致。
レートの前にあるテキストを照合し、一致した後のすべてのテキストを取得する方法はありますか?
これを行うためのより良い方法があれば、提案も受け付けています。正確な料金がわからない場合に、ウェブサイトから料金を取得する方法を知りたいだけです。料金の形式と料金がサイト内のどこにあるかを知っているだけです。
これが私がこれまでに持っているものです:
String regex = "(?<=EUR'>)\\d+(?:\\.\\d*)?(?=<)";
Pattern pattern = Pattern.compile(regex);
Matcher match = pattern.matcher(?);
while (match.find()) {
System.out.println("Found a match: " + match.group(1).toString());
System.out.println("Start position: " + match.start(1));
System.out.println("End position: " + match.end(1));
}
パターンの設定方法は理解していると思いますが、最初と最後だけがわかっていて、最後ではない場合、一致文字列に何を入れればよいかわかりません...
私がつかむ必要があるものの例は、以下の行です
<td class='rtRates'><a href='/graph/?from=USD&to=EUR'>0.772000</a></td>
この行のレートを取得する必要がありますが、常に変化します