php - URLリンクから数値IDを分離する

Question

私はstackoverflowを閲覧していて、ここで素晴らしい正規表現コードを見つけました。YouTubeビデオIDを分離する方法は他にもあるかもしれませんが、学習目的で正規表現を使用することにしました。input1（以下に示す）の正規表現コードは、&文字の後のすべてを無視します。これにより、ビデオIDが消去されるため、IDが正しくないか空になります。正規表現が後にすべてをクリアするのはなぜ&ですか？

エラー：

入力1： http ：//www.youtube.com/watch？ feature＆v = 317a815FLWQ

結果1：http // www.youtube.com / watch？feature

普通：

入力2： http ://www.youtube.com/watch? v=spDj54kf-vY&feature=g-vrec

結果2： http ://www.youtube.com/watch? v=spDj54kf-vY

正規表現コード（元のコメント付き）

$text = preg_replace('~
        # Match non-linked youtube URL in the wild. (Rev:20111012)
        https?://         # Required scheme. Either http or https.
        (?:[0-9A-Z-]+\.)? # Optional subdomain.
        (?:               # Group host alternatives.
          youtu\.be/      # Either youtu.be,
        | youtube\.com    # or youtube.com followed by
          \S*             # Allow anything up to VIDEO_ID,
          [^\w\-\s]       # but char before ID is non-ID char.
        )                 # End host alternatives.
        ([\w\-]{11})      # $1: VIDEO_ID is exactly 11 chars.
        (?=[^\w\-]|$)     # Assert next char is non-ID or EOS.
        (?!               # Assert URL is not pre-linked.
          [?=&+%\w]*      # Allow URL (query) remainder.
          (?:             # Group pre-linked alternatives.
            [\'"][^<>]*>  # Either inside a start tag,
          | </a>          # or inside <a> element text contents.
          )               # End recognized pre-linked alts.
        )                 # End negative lookahead assertion.
        [?=&+%\w-]*        # Consume any URL (query) remainder.
        ~ix', 
        '<a href="http://www.youtube.com/watch?v=$1">YouTube link: $1</a>',
        $text);
    return $text;

score 6 · Accepted Answer

忘れて、 parse_urlregexを使用してください：

Array
(
    [scheme] => http
    [host] => hostname
    [user] => username
    [pass] => password
    [path] => /path
    [query] => arg=value
    [fragment] => anchor
)

次に、URLの一部でparse_strを使用しqueryて、変数を抽出します。

編集

より良いデモは次のとおりです。

$url = "http://www.youtube.com/watch?feature&v=317a815FLWQ";

$parsed_url = parse_url($url);
$query = $parsed_url['query'];

$parsed_query = array();
parse_str($query, $parsed_query);

var_dump($parsed_query);

出力：

array(2) {
  ["feature"]=>
  string(0) ""
  ["v"]=>
  string(11) "317a815FLWQ"
}

編集2

コメントで指定された2番目のリンクからIDを抽出する別の例：

$url = "http://www.youtube.com/sandalsResorts#p/c/54B8C800269D7C1B/2/PPS-8DMrAn4";

$parsed_url = parse_url($url);
$fragment = $parsed_url['fragment'];
$fragment_parts = explode('/', $fragment);
$video_id = array_pop($fragment_parts);

print($video_id);

出力：

PPS-8DMrAn4

ただし、ユーザーからのリンクを要求する場合は、ユーザーを非常に具体的にする必要があります。2番目の例のリンクはビデオリンクではありませんが、ユーザーの入力を許可したい場合は、両方のコードスニペットを介してリンクを実行し、IDを取得したかどうかを確認できます。

php - URLリンクから数値IDを分離する

1 に答える 1

Related

Reference