Googleカレンダーからいくつかのイベントをインポートしていますが、これを行っています。
$ch = curl_init("my_google_calendar_url");
$fp = fopen("cal.xml", "w");
curl_setopt($ch, CURLOPT_FILE, $fp);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_exec($ch)
fclose($fp);
curl_close($ch);
すべてのデータをXMLファイルにダンプしていますが、データとともにすべてのhtmlタグも出力にダンプされ、出力が分割されます。
新しい休日日時:2012年12月21日金曜日13:00〜14:00&nbsp; IST <br>
<br>Where: Aus
<br>Event Status: confirmed</summary><content type='html'>When: Fri 21 Dec 2012 13:00 to 14:00
IST<br />
<br />Where: Aus
<br />Event Status: confirmed
<br />Event Description: It&#39;s going to be awesome.</content>
これは、xmlファイルで取得しているものの一部です。xmlデータを簡単に抽出できるように、「&lt」などのすべてのhtmlタグを削除したいと思います。