fff.htmlはメールアドレスが記載されたメールで、hrefのmailtoリンクがあるものとないものがあるので、スクレイピングして以下の形式で出力したい
Lorem@ipsum.com,dolor@sit.com,amet@consectetur.com
href リンクされているものを取得するための単純なスクレーパーがありますが、何かがおかしいです
<?php
$url = "fff.html";
$raw = file_get_contents($url);
$newlines = array("\t","\n","\r","\x20\x20","\0","\x0B");
$content = str_replace($newlines, "", html_entity_decode($raw));
$start = strpos($content,'<a href="mailto:');
$end = strpos($content,'"',$start) + 8;
$mail = substr($content,$start,$end-$start);
print "$mail<br />";
?>
lorem ipsum の元の使用に対して余分なポイントを取得する必要があります