アプリ名を取得するための情報について、Google Play リンクをスクレイピングしています。
問題は、一部のアプリケーションが判読できない文字を返すことです。
$div2 = $div->getElementsByTagName("div");
if ($div2->length)
{
$gpAppName = DOMinnerHTML($div2->item(0));
$counter++;
if(checkIfMaxedOutAndReturn($counter)){
buildObjAndReturn($gpIcon,$gpBg,$gpAppName,$gpBtnLink);
}
}
function DOMinnerHTML($element)
{
$innerHTML = "";
$children = $element->childNodes;
foreach ($children as $child)
{
$tmp_dom = new DOMDocument('1.0','UTF-8');
$tmp_dom->appendChild($tmp_dom->importNode($child, true));
$innerHTML.=trim($tmp_dom->saveHTML());
}
return $innerHTML;
}
ページをスクラップする場合: https://play.google.com/store/apps/details?id=com.vascogames.TransportTruck、ここに表示されるコードは、「トラック ドライバー – 貨物配達」というアプリ名をスクレイピングしますが、コードは「トラック ドライバー - 貨物配達」を返します