7

韓国語、インドネシア語、タイ語、ベトナム語用のオープンソースの POS タガーを誰か推薦できますか?

現在所有しているコーパス データにタグを付けるために使用できます。(例: stanford-postagger )

あなたが開発者で、共有して POS タガーをテストさせたいと思っているなら、私も気にしません。

出力をいくつか変更して、ベトナム語のデータにjvntextproで POS タグを付けました。

しかし、韓国語、インドネシア語、タイ語の POS タグ付けについては、まだ意見が欲しいです。

4

2 に答える 2

5

After acl wiki: Korean morphological analyzer and part-of-speech tagger

I would start to look on the websites of NLP research departments in Korea, Thailand, and Korean. On this page, you will find links to the research departments.

Good luck!

UPDATE: OpenNLP has thai PoS. Here are the models: http://opennlp.sourceforge.net/models/thai/ for PoS opennlp tagger.

于 2011-04-14T19:31:09.787 に答える
0

RDRPOSTaggerを試してみることをお勧めします。これは、POS および形態学的タグ付けのための堅牢で使いやすく、言語に依存しないツールキットです。

(プログラミング言語: Python & Java)

RDRPOSTagger は、学習プロセスとタグ付けプロセスの両方で高速なパフォーマンスを実現します。さらに、RDRPOSTagger は、最先端の結果と比較して、非常に優れた精度を実現しています。このホワイト ペーパーで、実行速度やタグ付けの精度などの実験結果を参照してください。

RDRPOSTagger は、タイ語やベトナム語を含む 13 言語の事前トレーニング済みの POS および形態学的タグ付けモデルをサポートするようになりました。

于 2015-11-20T07:47:13.337 に答える