件名と電子メール アドレスを含む URL を一覧表示するテキスト ドキュメントがあります。件名と電子メールアドレスを含むすべての URL を抽出し、これをすべて csv ファイルに入れる必要があります。これを行うために正規表現を使用する方法を知る必要があります。現在、すべての URL を抽出できますが、それらに関連付けられた電子メールと件名が必要です。これは私がこれまで取り組んでいるものです:
$file=file_get_contents('/data/urls.txt');
$pattern='([A-Za-z][A-Za-z0-9+.-]{1,120}:[A-Za-z0-9/](([A-Za-z0-9$_.+!*,;/?:@&~=-])|% [A-Fa-f0-9]{2}){1,333}(#([a-zA-Z0-9][a-zA-Z0-9$_.+!*,;/?:@&~=%-]{0,1000}))?)';
preg_match_all($pattern, $file, $matches);
$matches=array_unique($matches[0]);
print_r($matches);
ファイル構造:
件名: URL
電子メール: someemail@email.com
ソース URL: http://www.google.com