49

構文解析は私が開発でよく遭遇するものですが、ジュニアとして、それは必要なときにいつかコツをつかむと私が思うものの1つです。私の現在のプロジェクトでは、特定の関数にHTMLパーサーを見つけて使用するように言われましたが、Web上でいくつか見つけました。

しかし、HTMLパーサーは実際に何をしますか?そして、オブジェクトを解析することはどういう意味ですか?

4

8 に答える 8

75

解析は通常、テキストに適用されます。つまり、テキストを読み取り、それをより有用なメモリ内形式に変換して、それが何を意味するのかをある程度「理解」する行為です。したがって、たとえば、XMLパーサーは文字(またはバイト)のシーケンスを取得し、それらを要素や属性などに変換します。

場合によっては(特にコンパイラー)、字句解析と構文解析が分離されているため、パーサーの実際の「理解」部分は、生の文字ではなく、一連のトークン(識別子、演算子など)で機能します。

于 2009-11-24T09:04:29.573 に答える
17

構文解析とは、一連のデータを取得し、そこから意味のある情報を抽出することです。HTML解析を使用すると、HTMLを読み取り、構造化されたタグとテキストのセットを返すことができます。

于 2009-11-24T09:04:59.917 に答える
10

ここから開始できます:http://en.wikipedia.org/wiki/Parsing。短い抜粋:

構文解析または構文解析は、形式文法の規則に従って、自然言語またはコンピューター言語のいずれかで一連の記号を分析するプロセスです。構文解析という用語は、(品詞)を意味するラテン語の構文解析(orationis)に由来します。

于 2009-11-24T09:04:35.550 に答える
5

Dictionary.comによる解析 (コンピューター)

文字のグループを基礎となる文法の構文単位に関連付けるために(文字列)を分析すること。

于 2009-11-24T09:06:46.777 に答える
3

パーサーは、別の言語に簡単に翻訳できるようにデータを小さな要素に分割するコンパイラー/インタープリターコンポーネントです。パーサーは、一連のトークンまたはプログラム命令の形式で入力を受け取り、通常、解析ツリーまたは抽象構文ツリーの形式でデータ構造を構築します。

于 2013-06-11T06:13:31.103 に答える
2

コンピュータサイエンスと言語学では、構文解析、またはより正式には構文解析は、トークンのシーケンス(単語など)で構成されるテキストを分析して、特定の(より多くのまたは少ない)正式な文法。

:0)

ウィキペディア

于 2009-11-24T09:05:45.000 に答える
1

これは、HTML内のトークン[タグ、属性]を識別するプロセスです。

于 2009-11-24T09:04:56.687 に答える
1

些細なパーサー以外は自分で書き込もうとしないでください。この用途に適したツールがあります。ANTLRbisonは私が考えることができる2つです。

ツールを使用すると、問題が発生したときに助けを求めることができます。

乾杯、マーティン。

于 2009-11-24T11:20:35.863 に答える