9

私はスタンフォードコアNLPを使用しており、この行を使用していくつかのモジュールをロードし、テキストを処理しています。

props.put("annotators", "tokenize, ssplit, pos, lemma, ner, parse, dcoref");

テキストをチャンクするためにロードできるモジュールはありますか?

または、スタンフォードコアを使用してテキストをチャンク化するための代替方法に関する提案はありますか?

ありがとうございました

4

4 に答える 4

5

パーサー出力を使用して NP チャンクを取得できると思います。出力例を提供するStanford Parser Web サイトのコンテキストフリー表現を見てください。

于 2012-11-13T01:20:08.207 に答える
5

スタンフォード NLP でチャンクを使用するには、次のパッケージを使用できます。

  • YamCha: SVM ベースの NP チャンカー、POS タグ付け、NER などにも使用可能。C/C++ オープン ソース。CoNLL 2000 共有タスクを獲得しました。(エンドユーザー向けの特殊な POS タガーよりも自動ではありません。)
  • Mark Greenwood の Noun Phrase Chunker: Ramshaw と Marcus の Java 再実装 (1995 年)。
  • fnTBL: C++ での変換ベースの学習の高速で柔軟な実装。POS タガーだけでなく、NP チャンキングおよび一般的なチャンキング モデルも含まれています。

ソース: http://www-nlp.stanford.edu/links/statnlp.html#NPchunk

于 2013-04-23T02:07:50.977 に答える