Python の NLKT は *raw_parse* 関数を介してそれを行うことがわかりましたが、Java を使用する必要があります。cleartk には MaltParser ラッパーがあることがわかりましたが、それに関するドキュメントはありません。生の英語テキストを最初に MaltParser が使用できる conll ファイルに変換し、それを MaltParser で解析する関数またはプロジェクトを探しています。どんな助けでも大歓迎です。
質問する
1419 次
1 に答える
0
フォルダーexamples/apiexamples/srcexには、MaltParser 1.7.2 ディストリビューションに付属するサンプルがあります。
ただし、これらの例は、トークン化と pos タグ付けが既に実行された後 (およびこれらのステップの出力が CONLL のような形式に変換された後) にプログラムで MaltParser を実行する方法のみを示しています。
私は現在、より良い (より単純で短い) 代替手段を提供できないため、少なくとも、トークン化、品詞のタグ付け (OpenNLP を使用)、および依存関係の解析 (MaltParser を使用) を実行するGroovy スクリプトへのリンクを共有できます。これらのツールは、UIMA を使用して相互運用可能になっています。Maven に精通している場合は、そのスクリプトの Java バージョンを簡単に派生させることができます。
これは最善の答えではありませんが、現時点では何もしないよりはましです。
注: 私は Apache UIMA と DKPro Core (リンク先のプロジェクト) の両方の開発者です。
于 2013-07-24T19:08:39.670 に答える