0

このタイプのリストを含む Web ページがあり、約 500 項目の長さがあります。

<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>

このページのデータをエクセルに取り込みたいです。したがって、ここのデータを次のように変換したいと思います。

URL value  | URL Name | Text 

私は実際に解決します:

URL value | URL Name

私はこれを使用しています:

simple-html-dom を使用しました

<?php
require ('simple_html_dom.php');
$html = file_get_html('Etext_alt2.html');


foreach($html->find('a') as $element)
    echo $element->href .'<br>'; 
?>

これにより、URL 値の適切なリストが得られます。

他の属性にアクセスできるはずですが、何も機能しません。

私は間違ったものを使用していますか?これを行う最良の方法は何ですか?

4

1 に答える 1

-1

HTMLを解析せずにタスクを実行する例:

$html = '<br><a href="urlvalue" >URL Name 1</a> text</br>
<br><a href="urlvalue" >URL with a longer url</a>text</br>
<br><a href="urlvalue" >URL Name3 and this one too?</a> text</br>';

preg_match_all('#<br><a href="(.*)" >(.*)</a>(.*)</br>#', $html, $matches, PREG_SET_ORDER);

foreach ($matches as $row) {
    echo "{$row['1']} | {$row['2']} | {$row['3']}" . PHP_EOL;
}
于 2012-12-14T20:36:20.930 に答える