公開された結果ページをxml形式で取得し、その内容をローカルファイル「Publications.xml」に書き込むことができました。問題は、simplexml_load_file( "Publications.xml")を使用すると、失敗することです。理由がわからない。
<?php
$feed = 'http://www.ncbi.nlm.nih.gov/pubmed?term=carl&sort=pubdate&report=xml';
$local = 'Publications.xml';
$curtime = time();
$filemodtime;
if( (!file_exists($local)) || (time() - filemtime($local)) > 86400 )
{
$contents = file_get_contents($feed);
$fp = fopen($local,"w");
fwrite($fp, $contents);
fclose($fp);
}
$xml = simplexml_load_file($local) or ("Can't");
?>
最後の2行目でパーサーが失敗し、「できません」というメッセージが表示されます。xmlファイルを再確認しましたが、良好な状態であるように見えます。
誰かがこれの回避策について私に知らせてくれれば、私は非常に感謝します。上記のPHPスクリプトが読み取ろうとするxmlファイルのコピーは次のとおりです(http://pastebin.com/U0fEKmZL):
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<pre>
<PubmedArticle>
<MedlineCitation Status="Publisher" Owner="NLM">
<PMID Version="1">23314841</PMID>
<DateCreated>
<Year>2013</Year>
<Month>1</Month>
<Day>14</Day>
</DateCreated>
<Article PubModel="Print-Electronic">
<Journal>
<ISSN IssnType="Electronic">1432-0932</ISSN>
<JournalIssue CitedMedium="Internet">
<PubDate>
<Year>2013</Year>
<Month>Jan</Month>
<Day>12</Day>
</PubDate>
... (too long, see link)