1

1400 件のツイートのセットに対して、Syntaxnet を正常に構築して実行しました。解析されたファイルの各パラメータが何を意味するのか理解できません。たとえば、次の文があります。

Shoutout @Aetna for covering my doctor visit. Love you!

解析されたファイルの内容は次のとおりです。

1       Shoutout        _       NOUN    NNP     _       9       nsubj   _       _
2       @       _       ADP     IN      _       1       prep    _       _
3       Aetna   _       NOUN    NNP     _       2       pobj    _       _
4       for     _       ADP     IN      _       1       prep    _       _
5       covering        _       VERB    VBG     _       4       pcomp   _       _
6       my      _       PRON    PRP$    _       8       poss    _       _
7       doctor  _       NOUN    NN      _       8       nn      _       _
8       visit.  _       NOUN    NN      _       5       dobj    _       _
9       Love    _       VERB    VBP     _       0       ROOT    _       _
10      you     _       PRON    PRP     _       9       dobj    _       _
11      !       _       .       .       _       9       punct   _       _

各列の正確な意味は何ですか? POS タグ以外に空白や数字があるのはなぜですか?

4

1 に答える 1

1

このタイプの形式は、CoNLL 形式と呼ばれます。利用可能なさまざまなバージョンがあります。各列の意味はここで説明されています

于 2016-06-11T05:14:01.193 に答える