私はspaCy Python パッケージを使用してテキストを解析してタグ付けし、結果の依存関係ツリーとその他の属性を使用して意味を導き出しています。今は SyntaxNet の Parsey McParseface を構文解析と依存関係のタグ付けに使いたいと思っていますが (こちらの方が優れているようです)、spaCy API を使い続けたいと思っています。SyntaxNet は、POS タグと依存関係タグ/ツリーを CoNLL 形式で出力します。
- Bob _ NOUN NNP _ 2 nsubj _ _
- もたらした _ 動詞 VBD _ 0 ルート _ _
- the _ DET DT _ 4 det _ _
- ピザ _ NOUN NN _ 2 dobj _ _
- to _ ADP IN _ 2 prep _ _
- Alice _ NOUN NNP _ 5 pobj _ _
- . _ . . _ 2 点 _ _
そして、spaCy はここでCoNLL 形式を読み取ることができるようです。しかし、spaCy の API のどこで CoNLL 形式の文字列を取得するのかわかりません。