誰かがそれをどのように行うか考えていますか?私は現在、OffLiberty.comを使用してMixcloudリンクを解析し、iOS互換性のあるカスタムHTML5プレーヤーで使用するための生のMP3URLを取得しています。いわば仲介者から出て行くので、私のエンドユーザーは、投稿したいミックスのMP3へのリンクを取得するために外部サイトにアクセスする必要はありません。本当に考えただけで、それができなかったとしてもそれほど重要ではありませんが、いい感じになるでしょう:)
誰かアイデアはありますか?
私はコンテンツのスクレイピングに反対であり、それらの Web サイトの MP3 URL をスクレイピングする許可を求める必要があることに注意してください。そうでなければ、もし私が彼らだったら、今すぐあなたをブロックして、アドビタム æternam .
とにかく、を使用して HTML を解析できますDOMDocument
。
例えば :
<?php
// just so you don't see parse errors
$internal_errors = libxml_use_internal_errors(true);
// initialize the document
$doc = new DomDocument();
// load a page
$doc->loadHTMLFile('http://www.mixcloud.com/LaidBackRadio/le-motel-on-the-road/');
// initialize XPATH for the document
$xpath = new DomXPath($doc);
// span with "data-preview-url" seems to contain MP3 url
// we request them inside a DomNodeList http://www.php.net/manual/en/class.domnodelist.php
$mp3 = $xpath->query('//span[@data-preview-url]');
foreach($mp3 as $m){
// we print the attribute value
echo $m->attributes->getNamedItem('data-preview-url')->nodeValue . '<br/>';
}
libxml_use_internal_errors($internal_errors);