次のテキストがあるとします
..(content).............
<A HREF="http://foo.com/content" >blah blah blah </A>
...(continue content)...
リンクを削除したいのですが、タグを削除したいです (間にテキストを入れたまま)。正規表現でこれを行うにはどうすればよいですか (URL がすべて異なるため)
どうもありがとう
次のテキストがあるとします
..(content).............
<A HREF="http://foo.com/content" >blah blah blah </A>
...(continue content)...
リンクを削除したいのですが、タグを削除したいです (間にテキストを入れたまま)。正規表現でこれを行うにはどうすればよいですか (URL がすべて異なるため)
どうもありがとう
これにより、すべてのタグが削除されます。
preg_replace("/<.*?>/", "", $string);
<a>
これにより、タグのみが削除されます。
preg_replace("/<\\/?a(\\s+.*?>|>)/", "", $string);
特に xml を処理する場合は、できる限り正規表現を使用しないでください。この場合、文字列に応じてstrip_tags()
またはsimplexmlを使用できます。
<?php
//example to extract the innerText from all anchors in a string
include('simple_html_dom.php');
$html = str_get_html('<A HREF="http://foo.com/content" >blah blah blah </A><A HREF="http://foo.com/content" >blah blah blah </A>');
//print the text of each anchor
foreach($html->find('a') as $e) {
echo $e->innerText;
}
?>
PHP シンプル DOM パーサーを参照してください。
きれいではありませんが、仕事をします:
$data = str_replace('</a>', '', $data);
$data = preg_replace('/<a[^>]+href[^>]+>/', '', $data);
これを使用して、アンカーをテキスト文字列に置き換えます...
function replaceAnchorsWithText($data) {
$regex = '/(<a\s*'; // Start of anchor tag
$regex .= '(.*?)\s*'; // Any attributes or spaces that may or may not exist
$regex .= 'href=[\'"]+?\s*(?P<link>\S+)\s*[\'"]+?'; // Grab the link
$regex .= '\s*(.*?)\s*>\s*'; // Any attributes or spaces that may or may not exist before closing tag
$regex .= '(?P<name>\S+)'; // Grab the name
$regex .= '\s*<\/a>)/i'; // Any number of spaces between the closing anchor tag (case insensitive)
if (is_array($data)) {
// This is what will replace the link (modify to you liking)
$data = "{$data['name']}({$data['link']})";
}
return preg_replace_callback($regex, array('self', 'replaceAnchorsWithText'), $data);
}
$pattern = '/href="([^"]*)"/';
str_replace を使用する