GATE 組み込みからスタンフォード パーサーを使用する方法 (Java コードを介して GATE を使用)。現在、マシンで GATE_Developer_7.0 を使用しています。GATE に Stanford Parser のプラグインがあることは知っていますが、Java コードを使用してそれを使用する方法がわかりません。
ありがとう
GATE 組み込みからスタンフォード パーサーを使用する方法 (Java コードを介して GATE を使用)。現在、マシンで GATE_Developer_7.0 を使用しています。GATE に Stanford Parser のプラグインがあることは知っていますが、Java コードを使用してそれを使用する方法がわかりません。
ありがとう
GATE Embedded に対して常に推奨する通常のアプローチは、GATE Developer を使用してパイプラインを構築し、それをテストして、GUI でサンプル ドキュメントを処理してデバッグすることです。アプリケーションに満足したら、「アプリケーションの状態を保存」または「GATECloud.net にエクスポート」を使用して保存された状態を生成し、PersistenceManager
. これにより、必要なすべてのプラグインが自動的に読み込まれるようになり、通常は、コードで手動でパイプラインを構築しようとするよりもはるかに簡単でエラーが発生しにくくなります。
GATE Web サイトのBatchProcessApp の例は、保存されたアプリケーションを PersistenceManager でロードする方法を示しています。
Gate.init(); // always the first thing you do
CorpusController controller = (CorpusController)PersistenceManager
.loadObjectFromFile(new File("/path/to/application.xgapp"));
Corpus corpus = Factory.newCorpus("myCorpus");
controller.setCorpus(corpus);
次に、処理するドキュメントごとに
Document doc = Factory.newDocument(....);
corpus.add(doc);
try {
controller.execute();
// code here to do stuff with the annotated document, e.g. extract
// annotations/features
} finally {
corpus.clear();
Factory.deleteResource(doc);
}