16

Java-opennlp

私はopennlpが初めてで、文を分析して投稿タグとチャンクの結果を取得しようとしていますが、値の意味を理解できませんでした。post タグとチャンクの結果値の完全な意味を説明できる表はありますか?

Tokens: [My, name, is, Chris, corrale, and, I, live, in, Philadelphia, USA, .]
Post Tags: [PRP$, NN, VBZ, NNP, NN, CC, PRP, VBP, IN, NNP, NNP, .]
chunk Result: [B-NP, I-NP, B-VP, B-NP, I-NP, O, B-NP, B-VP, B-PP, B-NP, I-NP, O]
4

3 に答える 3

14

POS タグは、Penn Treebankタグセットからのものです。チャンクは、名詞句 (NP)、動詞句 (VP)、および前置詞 (PP) です。「B-..」はそのような句の始まりを示し、「I-..」は「内部」のようなものを意味します。つまり、句はここに続きます ( OpenNLP docsを参照)。

于 2013-02-25T17:19:20.607 に答える
11

S -> 単純な平叙節。すなわち、従属接続詞 (空の可能性あり) または Wh 単語によって導入されず、主語と動詞の反転を示さないもの。

SBAR -> (空の可能性がある) 従属接続詞によって導入された節。

SBARQ -> Wh-word または Wh-phrase によって導入される直接的な質問。間接疑問文と関係節は、SBARQ ではなく SBAR として括弧で囲む必要があります。

SINV -> 逆宣言文、つまり主語が時制動詞または法助動詞の後に続くもの。

SQ -> SBARQ の Wh フレーズに続く、逆の yes/no 質問、または Wh 質問の主節。

ADJP -> 形容詞句。

ADVP -> 副詞句。

CONJP -> 接続句。

FRAG -> フラグメント。

INTJ→間投詞。ほぼ品詞タグ UH に対応します。

LST -> リストマーカー。前後の句読点を含みます。

NAC -> 構成要素ではありません。NP 内の特定の前名修飾子の範囲を示すために使用されます。

NP -> 名詞句。

NX -> 特定の複雑な NP 内で、NP の先頭をマークするために使用されます。Nバーに非常に大まかに対応

PP -> 前置詞句。

PRN -> 括弧。

PRT -> パーティクル。RPタグを付ける単語のカテゴリ。

QP -> Quantifier Phrase (つまり、複雑な測定/量の句); NP 内で使用されます。

RRC -> 削減された関係条項。

UCP -> コーディネートされたフレーズとは異なります。

VP -> 動詞句。

WHADJP -> Wh-形容詞句。how hot のように、Wh-副詞を含む形容詞句。

WHAVP -> Wh-副詞句。NP ギャップのある句を導入します。null (0 補完子を含む) またはレキシカル (how や why などの副詞を含む) の場合があります。

WHNP -> Wh-名詞句。NP ギャップのある句を導入します。null (0 補完子を含む) または語彙で、Wh-word を含む場合があります。

WHPP -> Wh-前置詞句。PP ギャップを導入するか、WHNP に含まれる Wh 名詞句 (of や who の権限など) を含む前置詞句。

X -> 不明、不確実、またはブラケット不可能。X は、多くの場合、タイプミスを括弧で囲んだり、...構造を括弧で囲んだりするために使用されます。

クレジット: http://mail-archives.apache.org/mod_mbox/opennlp-users/201402.mbox/%3CCACQuOSXOeyw2O-AZtW3m=iABo1=3cpZOdPiWFXoNwN-SVWo4gQ@mail.gmail.com%3E

于 2014-12-18T13:49:25.123 に答える