重複の可能性:
PHP で HTML を解析および処理する方法は?
私は PHP を学んでおり、使用可能な API を持たない Web ページからデータを抽出 (解析) する必要がある場合は、正規表現または 2 つの文字列の間にある文字列を取る関数を使用します。
正規表現はリソースを消費し、今すぐ書くのが最も簡単なことではないため、これを行うためのより「専門的」で簡単な方法があるかどうかを知りたいです。
重複の可能性:
PHP で HTML を解析および処理する方法は?
私は PHP を学んでおり、使用可能な API を持たない Web ページからデータを抽出 (解析) する必要がある場合は、正規表現または 2 つの文字列の間にある文字列を取る関数を使用します。
正規表現はリソースを消費し、今すぐ書くのが最も簡単なことではないため、これを行うためのより「専門的」で簡単な方法があるかどうかを知りたいです。
正規表現を使用してXML(html)を解析しようとしないでください。代わりに、XML用の適切なパーサーライブラリを取得して、正しい方法で実行してください。大変な作業のように聞こえるかもしれませんが、最終的には感謝します。
解析は、以下のいずれか、または同様のリソースを使用して実行できます。
htmlと正規表現、読む価値のある詩に関する人気のある伝説的な答え:
PHPには、この特定の場合に使用できるデフォルトのXML解析ライブラリが付属しています。file_get_contents
HTMLページを取得し、それに応じて解析するために使用します。
XML: http: //php.net/manual/en/book.xml.php
file_get_contents: http: //php.net/manual/en/function.file-get-contents.php