構文解析は私が開発でよく遭遇するものですが、ジュニアとして、それは必要なときにいつかコツをつかむと私が思うものの1つです。私の現在のプロジェクトでは、特定の関数にHTMLパーサーを見つけて使用するように言われましたが、Web上でいくつか見つけました。
しかし、HTMLパーサーは実際に何をしますか?そして、オブジェクトを解析することはどういう意味ですか?
構文解析は私が開発でよく遭遇するものですが、ジュニアとして、それは必要なときにいつかコツをつかむと私が思うものの1つです。私の現在のプロジェクトでは、特定の関数にHTMLパーサーを見つけて使用するように言われましたが、Web上でいくつか見つけました。
しかし、HTMLパーサーは実際に何をしますか?そして、オブジェクトを解析することはどういう意味ですか?
構文解析とは、一連のデータを取得し、そこから意味のある情報を抽出することです。HTML解析を使用すると、HTMLを読み取り、構造化されたタグとテキストのセットを返すことができます。
ここから開始できます:http://en.wikipedia.org/wiki/Parsing。短い抜粋:
構文解析または構文解析は、形式文法の規則に従って、自然言語またはコンピューター言語のいずれかで一連の記号を分析するプロセスです。構文解析という用語は、(品詞)を意味するラテン語の構文解析(orationis)に由来します。
Dictionary.comによる解析 (コンピューター):
文字のグループを基礎となる文法の構文単位に関連付けるために(文字列)を分析すること。
パーサーは、別の言語に簡単に翻訳できるようにデータを小さな要素に分割するコンパイラー/インタープリターコンポーネントです。パーサーは、一連のトークンまたはプログラム命令の形式で入力を受け取り、通常、解析ツリーまたは抽象構文ツリーの形式でデータ構造を構築します。
コンピュータサイエンスと言語学では、構文解析、またはより正式には構文解析は、トークンのシーケンス(単語など)で構成されるテキストを分析して、特定の(より多くのまたは少ない)正式な文法。
:0)
これは、HTML内のトークン[タグ、属性]を識別するプロセスです。