Linux でアラビア語に GATE を使用していますが、Stanford Tagger を使用する場合、POS タグはありません。すべてのパラメーターが (デフォルトとして) 変更されていません。そのタスクを実行するにはどうすればよいですか? この問題はパラメータに依存しますか? taggerBinary パラメータで設定する必要があるタガーのインストール ディレクトリはどれですか?
1 に答える
1
まず、GATE で新しい StanfordPOSTaggerPR を作成し、StanfordTagger でarabic.tagger
提供されるモデルで Tagger を初期化する必要があります。
GATE の最新バージョンは 8.0 で、StanfordTagger 3.4 を使用しています。したがって、このバージョンで提供されるモデルをダウンロードする必要があります。
次に、SentenceSplitter と Tokeniser を使用してコーパス パイプラインを作成する必要があります (私は と で試しましUnicodeTokeniser
たRegExp SentenceSplitter
)。
最後に、サンプル ファイルを使用してパイプラインを試します。
于 2014-11-27T16:46:33.903 に答える