正規表現を使用して.pdfファイル名のスペースを認識したい
これまでのところ、ファイルへのsrcリンクを認識できましたが、ファイル名のスペースを認識しません。
<?php
echo "<h1>Reading content from ITM website!</h1>";
$ch = curl_init("http://domain.edu/index.php?option=com_content&view=article&id=58&Itemid=375&alias=lms");
$fp = fopen("example_homepage.txt", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch);
curl_close($ch);
$my_file="example_homepage.txt";
$handle = fopen($my_file, 'rb');
$data = fread($handle,filesize($my_file));
$contents = strstr(file_get_contents('example_homepage.txt'), 'More quick links');
$new_content = str_replace('<a href="', '<a href="http://www.domain.edu', $contents);
$regex = '@((https?://)?([-\w]+\.[-\w\.]+)+\w(:\d+)?(/([-\w/_\.\,]*(\?\S+)?)?)*)@';
$text = preg_replace($regex, '<a href="$1">$1</a>', $new_content);
//echo $new_content;
echo $text;
fclose($fp);
?>
現在の出力:
http://www.domain.edu/academiccalendar/Notice for final practical.pdf" target="_blank">Title
この「最終的なpractical.pdfの通知」では、URLとして表示されず、テキストとして表示されます。