次のような<li>
タグがいくつかあります。<div>
<li> <a href="link1"> one <li>
<li> <a href="link2"> two <li>
<li> <a href="link3"> three <li>
HTML DOM パーサーを使用してテキストを取得し、two
それを配列に入れて後で使用するにはどうすればよいですか?
タグが閉じていることを確認する必要がありa
ます。そうすれば、次のように実行できます。
<?php
$html = '<li> <a href="link1"> one </a> <li>
<li> <a href="link2"> two </a> <li>
<li> <a href="link3"> three </a> <li>
';
// Create a new DOM Document
$xml = new DOMDocument();
// Load the html contents into the DOM
$xml->loadHTML($html);
// Empty array to hold all links to return
$result = array();
//Loop through each <li> tag in the dom
foreach($xml->getElementsByTagName('li') as $li) {
//Loop through each <a> tag within the li, then extract the node value
foreach($li->getElementsByTagName('a') as $links){
$result[] = $links->nodeValue;
}
}
//Return the links
print_r($result);
/*
Array
(
[0] => one
[1] => two
[2] => three
)
*/
?>
そのすべてがdomDocumentのマニュアルにあります
これを実現するには、 Simple HTMLDomParserの使用を検討してください。サンプルコード:
// include the simple html dom parser
include 'simple_html_dom.php';
// load the html with one of the sutiable methods available with it
$html = str_get_html('<li><a href="link1">one</a></li><li><a href="link2">two</a></li>');
// create a blank array to store the results
$items = array();
// loop through "li" elements and store the magic plaintext attribute value inside $items array
foreach( $html->find('li') as $li ) $items[] = $li->plaintext;
// this should output: Array ( [0] => one [1] => two )
print_r( $items );