java - 単純な Java Regex が 2 つの間で読み取られる

Question

テキストのソースページがあり、このようにフォーマットされたリンクが含まれていることを知っています

img src="http://someurl および -t1 で終わる

img src と -t1 の間にあるものをすべて抽出しようとしています。完璧である必要はありません。"http... または src="http... などで作業できます。ソースコードをその URL の周りにトリミングしたいだけです。私は正規表現について読んでいますが、ロジックを理解できないようです。誰でも助けることができますか？

    File workfile = new File("page.txt");
    BufferedReader br = new BufferedReader(new FileReader(workfile));
    String line;
    while ((line = br.readLine()) != null) {
        //System.out.println(line);

        //Pattern p = Pattern.compile("src"+"t1");  ???
        //Matcher m = p.matcher("t1");              ???

    }
    br.close();

編集：使用して解決：

String url = line.split("<img src=")[1].split("-t1")[0];    
System.out.println(url);

すべての返信に感謝します。

score 2 · Accepted Answer

String url = <your url eg... img src='http://someurl and ends with -t1'>

String whatYouWant = url.split("img src")[1].split("-t1")[0];

whatYouWantあなたが必要とする文字列です

score 0 · Accepted Answer

Pattern pattern = Pattern.compile("img src(.+?)-t1");
Matcher matcher = pattern.matcher("img src=\"http://someurl-t1");
matcher.find();
System.out.println(matcher.group(1)); // Prints String I want to extract

score 0 · Accepted Answer

すべての URL が例と似ている場合は、次のようなことができます。

    String src="img src=\"http://someurl and ends with -t1\"";
    String[] url=src.split("img src");
    String[] str=url[1].split("-t1");
    System.out.println(str[0]);

java - 単純な Java Regex が 2 つの間で読み取られる

3 に答える 3

Related

Reference