水平マルコビゼーション(NLPコンセプト)を実装する必要があり、木がどのように見えるかを理解するのに少し苦労しています。Klein and Manningの論文を読んでいますが、2次または3次の水平方向のマルコビゼーションを行った木がどのようになるかについては説明されていません。誰かがアルゴリズムと木がどのように見えると思われるかについていくつかの光を当てることができますか?私はNLPに比較的慣れていません。
2 に答える
したがって、次のようなフラットなルールがたくさんあるとしましょう。
NP
NNP
NNP
NNP
NNP
また
VP
V
Det
NP
これらを2値化するときは、コンテキストを維持する必要があります(つまり、これは単なるDetではなく、具体的にはVPの一部として動詞に続くDetです)。通常これを行うには、次のような注釈を使用します。
NP
NNP
NP->NNP
NNP
NP->NNP->NNP
NNP
NP->NNP->NNP->NNP
NNP
また
VP
V
VP->V
Det
VP->V->Det
NP
ツリーを2値化する必要がありますが、これらの注釈は必ずしも非常に意味があるとは限りません。動詞句の例では多少意味があるかもしれませんが、他の例で本当に気になるのは、名詞句がかなり長い適切な名詞の文字列である可能性があることです(例:「PeterB.LewisBuilding」または「HopeMemorial Bridge Project記念日")。したがって、水平マルコビゼーションを使用すると、注釈の一部をわずかに折りたたんで、コンテキストの一部を破棄します。マルコビゼーションの順序は、保持するコンテキストの量です。したがって、通常の注釈を使用すると、基本的に無限の順序になります。つまり、すべてのコンテキストを保持し、何も折りたたむことを選択しません。
順序0は、すべてのコンテキストを削除し、次のような派手な注釈のないツリーを取得することを意味します。
NP
NNP
NNP
NNP
NNP
NNP
NNP
NNP
順序1は、コンテキストの用語を1つだけ保持し、次のようなツリーを取得することを意味します。
NP
NNP
NP->...NNP **one term: NP->**
NNP
NP->...NNP **one term: NP->**
NNP
NP->...NNP **one term: NP->**
NNP
順序2は、2つのコンテキスト用語を保持し、次のようなツリーを取得することを意味します。
NP
NNP
NP->NNP **two terms: NP->NNP**
NNP
NP->NNP->...NNP **two terms: NP->NNP->**
NNP
NP->NNP->...NNP **two terms: NP->NNP->**
NNP
ルールの確率を推定する際には、垂直方向のマルコビゼーションの親ノードと水平方向の兄弟ノードを考慮に入れるという考えであり、順序はそれらがいくつ含まれているかを示していると思います。ここに親の注釈の素敵な写真があります。
また、 http : //www.timothytliu.com/files/NLPAssignment5.pdfからの引用:
語彙化に取り組むために、各ツリーの親ノードにさらに情報が追加されます。これにより、異なるアタッチメントと、左に分岐するか右に分岐するかが正しく区別されます。水平マルコビゼーションは、ツリーが2値化されるときに兄弟を追跡することによって実現されます。垂直マルコビゼーションは、ツリー内のノードの親を追跡することによって実現されます。ルールは深さと幅の両方の組み合わせであるため、これらは新しい依存関係を作成します。