1

Linux でアラビア語に GATE を使用していますが、Stanford Tagger を使用する場合、POS タグはありません。すべてのパラメーターが (デフォルトとして) 変更されていません。そのタスクを実行するにはどうすればよいですか? この問題はパラメータに依存しますか? taggerBinary パラメータで設定する必要があるタガーのインストール ディレクトリはどれですか?

4

1 に答える 1

1

まず、GATE で新しい StanfordPOSTaggerPR を作成し、StanfordTagger でarabic.tagger提供されるモデルで Tagger を初期化する必要があります。

GATE の最新バージョンは 8.0 で、StanfordTagger 3.4 を使用しています。したがって、このバージョンで提供されるモデルをダウンロードする必要があります。

ここに画像の説明を入力

次に、SentenceSplitter と Tokeniser を使用してコーパス パイプラインを作成する必要があります (私は と で試しましUnicodeTokeniserRegExp SentenceSplitter)。

ここに画像の説明を入力

最後に、サンプル ファイルを使用してパイプラインを試します。

ここに画像の説明を入力

于 2014-11-27T16:46:33.903 に答える