2

テキストのソースページがあり、このようにフォーマットされたリンクが含まれていることを知っています

img src="http://someurl および -t1 で終わる

img src と -t1 の間にあるものをすべて抽出しようとしています。完璧である必要はありません。"http... または src="http... などで作業できます。ソースコードをその URL の周りにトリミングしたいだけです。私は正規表現について読んでいますが、ロジックを理解できないようです。誰でも助けることができますか?

    File workfile = new File("page.txt");
    BufferedReader br = new BufferedReader(new FileReader(workfile));
    String line;
    while ((line = br.readLine()) != null) {
        //System.out.println(line);

        //Pattern p = Pattern.compile("src"+"t1");  ???
        //Matcher m = p.matcher("t1");              ???

    }
    br.close();

編集:使用して解決:

String url = line.split("<img src=")[1].split("-t1")[0];    
System.out.println(url);

すべての返信に感謝します。

4

3 に答える 3

2
String url = <your url eg... img src='http://someurl and ends with -t1'>

String whatYouWant = url.split("img src")[1].split("-t1")[0];

whatYouWantあなたが必要とする文字列です

于 2013-07-17T06:34:06.610 に答える
0
Pattern pattern = Pattern.compile("img src(.+?)-t1");
Matcher matcher = pattern.matcher("img src=\"http://someurl-t1");
matcher.find();
System.out.println(matcher.group(1)); // Prints String I want to extract
于 2013-07-17T06:34:23.773 に答える
0

すべての URL が例と似ている場合は、次のようなことができます。

    String src="img src=\"http://someurl and ends with -t1\"";
    String[] url=src.split("img src");
    String[] str=url[1].split("-t1");
    System.out.println(str[0]);
于 2013-07-17T06:36:55.230 に答える