2

文字列が有効な URL であるかどうかを確認するための最適な正規表現は何ですか?に基づいて URL 検証を試みています。java ですが、何らかの理由で機能しません。提案?

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class urlValidate {

    /**
     * @param args
     */
    public static void main(String[] args) {
        test_url("http://brb/", false);
            test_url("https://localserver/projects/public/assets/javascript/widgets/UserBoxMenu/widget.css", false);
    test_url("https://www.google.com/", true);
    test_url("https://www.google.co.uk/projects/my%20folder/test.php", false);
    test_url("https://myserver.localdomain/", true);
    test_url("https://192.168.1.120/projects/index.php/", false);
    test_url("https://192.168.1.1/", true);
    test_url("https://projectpier-server.localdomain/projects/public/assets/javascript/widgets/UserBoxMenu/widget.css", false);
    test_url("https://2.4.168.19/project-pier?c=test&a=b", false);
    test_url("https://localhost/a/b/c/test.php?c=controller&arg1=20&arg2=20", false);
    test_url("https://user:password@localhost/a/b/c/test.php?c=controller&arg1=20&arg2=20", false);
    test_url("myserver",false);
    test_url("https://tomcat:8080/",true);
    test_url("https://facebook.com",false);
}

public static void test_url(String url, boolean expected) {
    boolean valid = isURLValid(url, true);
    String out = "URL Valid?: " + (valid ? "yes" : "no") + " for URL: "
            + url + ". Expected: " + (expected ? "yes" : "no") + ". ";
    if (valid == expected) {
        out += "PASS\n";
    } else {
        out += "FAIL\n";
    }
    System.out.println(out);
}

public static boolean isURLValid(String url, boolean forcehttps) {
    String regex = "";
    if (forcehttps) {
        regex = "/^(https):\\/\\/";
    } else {
        regex = "/^(https?):\\/\\/";
    }
    regex += "((([a-z0-9]\\.|[a-z0-9][a-z0-9-]*[a-z0-9]\\.)*"
            + "[a-z][a-z0-9-]*[a-z0-9]"
            + "|((\\d|[1-9]\\d|1\\d{2}|2[0-4][0-9]|25[0-5])\\.){3}"
            + "(\\d|[1-9]\\d|1\\d{2}|2[0-4][0-9]|25[0-5])"
            + ")(:\\d+)?)"
            + "(#([a-z0-9$_\\.\\+!\\*\\'\\(\\),;:@&=-]|%[0-9a-f]{2})*)?(\\/)"
            + "$/i";

    Pattern p = Pattern.compile(regex);
    Matcher m = p.matcher(url); // get a matcher object
    return m.matches();
}

}
4

3 に答える 3

2

正規表現は、最初はスラッシュで囲まれています (PHP の PCRE に必要な区切り文字として機能するため)。Java はこれらを使用しません。

if (forcehttps) {
    regex = "^(https):\\/\\";
} else {
    regex = "^(https?):\\/\\";
}

最後の/iも望ましくありません。代わりに、

Pattern p = Pattern.compile(regex, Pattern.CASE_INSENSITIVE)
于 2013-02-21T18:25:48.993 に答える
1

Apachecommons-validatorapiを使用できます。UrlValidatorという名前のクラスなどがあります。
これを見てください:http://commons.apache.org/validator/
私は多くの正規表現を理解していないので、この主題であなたをあまり助けることができません。
幸運を。

于 2013-02-21T18:27:30.470 に答える
0

URL検証に正規表現を書くことは問題ではありませんが、java.io.URLクラスを使用しないのはなぜですか? URL次のようなインスタンスを作成するだけで、構文が間違っている場合new URL(spec)にスローされます。MalformedURLExcption

于 2013-02-21T18:30:21.660 に答える