0

さて、タグ間のテキストをフェッチし、file_get_html を使用すると、テキストが異なるエンコーディングで返されます。これが私が行うことです:

$name = $dom->find('h1');
$name = $name[0]->plaintext; 
$name = html_entity_decode($name);
$name = utf8_decode($name);

html_entity_decode はゴミのほとんどを削除しますが、「from '–」などの兆候がまだ表示されます。これはエンコーディングの問題であることがわかったので、utf8_decode を使用して、「」を「?」に変更しますが、どうすれば元に戻すことができますか?元の「-」値に? クイックフィックスはありますか?

私はエンコーディングなどについてあまり理解していません。どんな助けも大いに感謝します

4

0 に答える 0