0

Web ページのインデックスを作成しています。このコードは、Web ページをスキャンして、リンクと、指定されたタイトルの Web ページを探します。リンクとタイトルは、2 つの異なる配列に格納されます。Array という単語の後にリンクが続き、その後にリンクの個々のタイトルが続く多次元配列を作成したいと思います。私はコードを持っていますが、それをまとめる方法がわかりません。

     require_once('simplehtmldom_1_5/simple_html_dom.php');
require_once('url_to_absolute/url_to_absolute.php');
 //links
$links = Array();
$URL = 'http://www.youtube.com'; // change it for urls to grab  
// grabs the urls from URL 
$file  = file_get_html($URL);
foreach ($file->find('a') as $theelement) {
   $links[] = url_to_absolute($URL, $theelement->href);
} 
print_r($links);
   //titles
  $titles = Array();
  $str = file_get_contents($URL);  
  $titles[] = preg_match_all( "/\<title\>(.*)\<\/title\>/", $str, $title );

   print_r($title[1]);
4

2 に答える 2

1

タイトルと同じ量のリンクがあると仮定すると、これを行うことができるはずであり、それらは同じ配列キーに対応する必要があります。

$newArray = array();

        foreach ($links as $key=>$val)
        {
            $newArray[$key]['link'] = $val;
            $newArray[$key]['title'] = $titles[$key];
        }
于 2012-09-16T13:53:04.407 に答える
0

あなたが何を望んでいるのかは明らかではありません。

とにかく、コードをより整理された方法で書き直す方法は次のとおりです。

require_once('simplehtmldom_1_5/simple_html_dom.php');
require_once('url_to_absolute/url_to_absolute.php');

$info = array();

$urls = array(
    'http://www.youtube.com',
    'http://www.google.com.br'
);

foreach ($urls as $url)
{
    $str = file_get_contents($url);
    $html = str_get_html($str);

    $title = strval($html->find('title')->plaintext);

    $links = array();
    foreach($html->find(a) as $anchor)
    {
        $links[] = url_to_absolute($url, strval($anchor->href));
    }
    $links = array_unique($links);

    $info[$url] = array(
        'title' => $title,
        'links' => $links
    );
}

print_r($info);
于 2012-09-16T13:59:05.897 に答える