ツリー形式の文法と一緒に文があります。可能な限り最高の解析を提供できるように、それから確率的文脈自由文法をトレーニングする必要があります。最適な解析を得るために Viterbi CKY アルゴリズムを使用しています。文は次のツリー形式になっています: (TOP (S (NP (DT The) (NN flight))) (VP (MD should) (VP (VB be) (NP (NP (CD eleven) (RB am))) ( NP (NN 明日)))))) (PUNC .))
Penn Treebank の ATIS セクションから確率文法を学習し、上記の文の可能な解析出力を与えることができるシステムを構築しました。
注釈を使用して精度を向上させる水平および垂直マルコフ化手法について読みました。それらがどのように機能するかについて、私は少し混乱しています。誰かが私をいくつかの説明的な例に案内したり、それらがどのように機能し、精度にどのように影響するかを説明できますか.