問題タブ [malt-parser]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
360 参照

java - NLP は、conll 形式を使用するプログラムを見つけます

ここで、テキストの情報を処理する必要があるプロジェクトを行っています。私は opennlp を使用し、freeling を試してみましたが、どちらも良い結果が得られました (補題、文による除算、フレーズによる除算、および POS)。しかし、その後、この CONLL ( http://www.linguateca.pt/floresta/CoNLL-X/ ) ファイルで maltparser をトレーニングしました。malparser が使用する POS タグは、opennlp や freeling とは異なります。これを行う方法は、POS タグ形式を opennlp (または freeling) に変換して、マルパーサーが受け入れられるようにすることです。私が知りたかったのは、CONLL 形式を使用して彼のアルゴリズムをトレーニングするプログラムがあるかどうかです。これにより、取得した POS とレンマがマルパーサーによって認識されます。可能であれば、Java と Windows で動作するプログラム。

タイ

0 投票する
1 に答える
277 参照

java - Maltparser モデルのトレーニングに関する問題

Bangla の Maltparser モデルをトレーニングしようとしています。Conllu Format で小さなコーパスに注釈を付けました。しかし、それは私にヌルポインタエラーを与えます。そこで、UDのウェブサイトから集めたツリーバンクで試してみました。そして、それらのデータセットで動作します。私の質問は

  1. XPOSTAG なしで Maltparser モデルをトレーニングできますか? UPOSTAG フィールドに注釈を付けましたが、XPOSTAG フィールドは UPOSTAG の単なるコピーです。XPOSTAG に注釈を付ける必要がありますか? これが、私のツリーバンクと UD ​​ツリーバンクの唯一の違いです。

  2. 評価目的なので、UPOSTAG を XPOSTAG に自動変換できますか?

参照: http://universaldependencies.org/format.html

理解を深めるために、私の銀行とUD銀行の両方の例を挙げています

私の例の銀行(間違いやいくつかの空のフィールドがあります)(言語はバングラ語です)

UDバンク