stanford-nlp - stanford-nlpでテキストをチャンクする

Question

私はスタンフォードコアNLPを使用しており、この行を使用していくつかのモジュールをロードし、テキストを処理しています。

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");

テキストをチャンクするためにロードできるモジュールはありますか？

または、スタンフォードコアを使用してテキストをチャンク化するための代替方法に関する提案はありますか？

ありがとうございました

score 5 · Accepted Answer

パーサー出力を使用して NP チャンクを取得できると思います。出力例を提供するStanford Parser Web サイトのコンテキストフリー表現を見てください。

score 5 · Accepted Answer

スタンフォード NLP でチャンクを使用するには、次のパッケージを使用できます。

YamCha: SVM ベースの NP チャンカー、POS タグ付け、NER などにも使用可能。C/C++ オープンソース。CoNLL 2000 共有タスクを獲得しました。(エンドユーザー向けの特殊な POS タガーよりも自動ではありません。)
Mark Greenwood の Noun Phrase Chunker: Ramshaw と Marcus の Java 再実装 (1995 年)。
fnTBL: C++ での変換ベースの学習の高速で柔軟な実装。POS タガーだけでなく、NP チャンキングおよび一般的なチャンキングモデルも含まれています。

4 に答える 4