ひどい(信じてください)HTML構造のHTMLファイルを解析しようとしていますが、これと知識が不足しているため、独自のパーサーを作成できませんでした。後で、Simple HTML Domパーサーを使用してみました。これは、多くの人(SOでも)が推奨しているためです。
simple_html_dom.phpが必要で、オブジェクトを作成しました。それらは機能しているようで、require()関数は「1」を返し、var_dump()-オブジェクトはオブジェクトを返します。
この後、マニュアルと同じようにURLを読み込もうとしましたが、どのURLを試しても致命的なエラーが発生しました。エラーは次のとおりです。
Fatal error: Call to undefined function mb_detect_encoding() in
/home/fema/web/subdomain/devel/www_root/parser/
simplehtmldom_1_5/simple_html_dom.php on line 988
988行目で確認したところ、次のようになっています。
// Have php try to detect the encoding from the text given to us.
$charset = mb_detect_encoding($this->root->plaintext . "ascii",
$encoding_list = array( "UTF-8", "CP1252" ) );
これは文字エンコードに関するものだと理解していますが、それだけです。私はこれについてグーグルでもSOでも何も見つけていません。
私のコード全体は(プレースホルダーURL)です:
<?php
require('simplehtmldom_1_5/simple_html_dom.php');
// Create a DOM object
$dom = new simple_html_dom();
$dom->load_file('http://www.google.com/');
?>
誰か教えてくれませんか?または、このようなことが起こったときのある種のアドバイス。
前もって感謝します。