テキストのソースページがあり、このようにフォーマットされたリンクが含まれていることを知っています
img src="http://someurl および -t1 で終わる
img src と -t1 の間にあるものをすべて抽出しようとしています。完璧である必要はありません。"http... または src="http... などで作業できます。ソースコードをその URL の周りにトリミングしたいだけです。私は正規表現について読んでいますが、ロジックを理解できないようです。誰でも助けることができますか?
File workfile = new File("page.txt");
BufferedReader br = new BufferedReader(new FileReader(workfile));
String line;
while ((line = br.readLine()) != null) {
//System.out.println(line);
//Pattern p = Pattern.compile("src"+"t1"); ???
//Matcher m = p.matcher("t1"); ???
}
br.close();
編集:使用して解決:
String url = line.split("<img src=")[1].split("-t1")[0];
System.out.println(url);
すべての返信に感謝します。