4

NLP の一般的なアプローチは、次のような一連のプロセスです。

  1. トークン化
  2. 形態素解析
  3. POSタグ付け
  4. 構文解析、固有表現認識、名詞句チャンキングなど
  5. 分類 (またはプログラムの「最終目標」)

各ステップが後段のステップに「相談」せずに決定を下すのは奇妙だといつも思っていました。たとえば、単語を名詞として POS タグ付けする場合がありますが、それにより処理の後半で構文解析が不可能になったとしてもです。

この一般的な NLP 問題に対して、事後手順を考慮したアプローチがあるかどうか疑問に思っていました。あなたがそうするなら、一種の信念の伝播。

4

2 に答える 2

1

Hollingshead と Roark による "Pipeline Iteration" (http://acl.ldc.upenn.edu/P/P07/P07-1120.pdf) と、Kristy Hollingshead によるパイプライン全般に関するその後の作業と、パイプライン ステージ。

于 2012-10-15T21:41:08.950 に答える
0

あなたが説明したパイプは、一般的に構造化されたアプリケーションの数ですが、可能なアーキテクチャはそれだけではありません。一部のアプローチでは、パイプラインを複数回通過する必要があり、1 つのステージからの情報が次のステージで使用されます。他の作業では、形態素解析や PoS タグ付けなど、リストした手順のいくつかを組み合わせています。私は最近、"A Hierarchical Dirichlet Process Model for Joint POS and Morphology Induction" という論文を読みました。そこでは、PoS タグと形態は共依存であるため一緒に誘導されます。

于 2012-10-11T10:54:22.540 に答える