テキスト処理のコンテキストでチャンカーとは何か、その使用法は何か知っている人はいますか?
12844 次
3 に答える
13
これらのスライドによると、チャンクは構文解析の代替手段であり、構文解析が完全ではなく、ツリーの深さが制限された文の部分的な構文構造を提供します。
完全な解析よりも制限がありますが、情報の抽出または無視に関しては十分であり、解析よりも高速で堅牢であるため、何度も使用されます。
スライドには、さらに多くの情報があります。
その他のリンク:
于 2011-01-21T11:00:55.777 に答える
7
私は他の答えに個人的に同意しませんが、ジュラフスキーとマーティンはわずかに異なる定義を与えています。彼らにとって、チャンキングは具体的には再帰的なフレーズがない浅い構文解析のタイプです。
彼らが与える一例は、「デンバーからの飛行」というフレーズです。チャンカーによって生成されない1つの構文解析は、「[NP the Flight [PP from [NP Denver]]]」です。これは、NP再帰性のある文法を意味するためです。
于 2013-05-08T10:48:20.310 に答える
4
これは、シャローパーサと呼ばれる非常に単純なタイプの構文解析です。OpenNLPプロジェクトには利用可能なチャンカーモジュールがあり、実際のチャンクの例についてはそのドキュメントを参照できます。
于 2011-01-21T11:02:52.913 に答える