0

cURL でページをダウンロードし、「PHP Simple HTML DOM Parser」で html を解析しました。問題は、要素の外側の html を表示するときに、スペイン語の文字が正しくないことです。例えば:

原文

la puja por la compra de los derechos de publicación ha sido la más reñida del año.

表示されたテキスト

la puja por la compra de los derechos de publicación ha sido la más reíida del año.

文字が変化する原因は何ですか?

4

3 に答える 3

2

出力に複数の文字として表示されているため、マルチバイト UTF8 文字をシングルバイト文字セット (おそらく ISO-8859-1) で表示しようとしているために発生していると確信しています。

少し前に書いたこのブログ投稿を見てください。潜在的な問題領域のすべてについて説明しています。

于 2012-04-23T13:22:56.557 に答える
1

間違った文字エンコーディング - 全体のエンコーディングが一貫していることを確認してください。UTF-8 をお勧めします

于 2012-04-23T13:18:43.823 に答える
0

ダウンロードしたページのエンコーディングを特定し、(iconv などで) エンコーディングに変換する必要があります。

PHP: curl_exec の出力を UTF8 に変換するを参照してください。

于 2012-04-23T13:18:35.830 に答える