0

私はこのページtest1.phpをこの別のページtest.phpに持っています。私はこのphpコードを実行しています:

 <?php 
    libxml_use_internal_errors(true); 
    $doc = new DOMDocument(); 
    $doc->loadHTMLFile("http://inviatapenet.gethost.ro/sop/test1.php"); 
    $xpath = new DOMXpath($doc); 
    $elements = $xpath->query("//*[@type='text/javascript']/@fid");
        if (!is_null($elements)) {
            foreach ($elements as $element) {
                $nodes = $element->childNodes;
                foreach ($nodes as $node) {
                    echo $node->nodeValue. "\n";
                }
            }
        }
?>

しかし、何も示しません。

私はそのページから取得しようとしていますが、 fid="x8qfp3cvzbxng8e" のコンテンツのみ:

この行から

<script type="text/javascript"> fid="x8qfp3cvzbxng8e"; v_width=640;
v_height=360; </script>

出力は次のようになります。

x8qfp3cvzbxng8e

私は何をしなければなりませんか?

4

1 に答える 1

0

コンテンツのみが必要fidな場合は、この正規表現を使用します

 preg_match_all('~fid="(.*?)"~si',$Text,$Match);
 print_r($Match);

サンプルの出力

 Array
(
   [0] => Array
    (
        [0] => fid="x8qfp3cvzbxng8e"
    )

   [1] => Array
    (
        [0] => x8qfp3cvzbxng8e
    )

)

テキストを抽出するためにこれを試してください。これはscriptコンテンツを表示しませんが、必要に応じてこの条件を削除できます

 function extractText($node) {
     if($node==NULL)return false;    
     if (XML_TEXT_NODE === $node->nodeType || XML_CDATA_SECTION_NODE === $node->nodeType) {
         return $node->nodeValue;
     } else if (XML_ELEMENT_NODE === $node->nodeType || XML_DOCUMENT_NODE === $node->nodeType || XML_DOCUMENT_FRAG_NODE === $node->nodeType) {
       if ('script' === $node->nodeName) return '';

       $text = '';
       foreach($node->childNodes as $childNode) {
          $text .= extractText($childNode);
       }
       return $text;
     }
}

サンプル

 $Text=file_get_contents("http://inviatapenet.gethost.ro/sop/test1.php");
 preg_match_all('~fid="(.*?)"~si',$Text,$Match);
 $fid=$Match[1][1];
 echo $fid;
于 2013-04-10T13:00:22.447 に答える