問題タブ [pos-tagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1893 参照

nlp - 結果を conll 形式で出力します (POS タグ付け、stanford pos tagger)

Stanford POS-tagger を使用しようとしています。英語のテキストを解析して (実際には pos タグだけで十分です)、結果を conll 形式で出力できるかどうかを尋ねたいと思います。そのようなオプションはありますか?

Stanford pos tagger の完全な 3.2.0 バージョンを使用しています

どうもありがとう

0 投票する
1 に答える
1056 参照

java - Eclipseでスタンフォードnlp pos taggerを再トレーニングする

私はnlpにかなり慣れていないので、posのタグ付けを理解しようとしています. 現在、スタンフォード nlp pos tagger を試しています。URL: http://nlp.stanford.edu/software/tagger.shtml

上記のリンクから、次の文があります。

タガーは、その言語の POS 注釈付きトレーニング テキストがあれば、任意の言語で再トレーニングできます。

しかし、私はそれを機能させることができません。今できることは、タグ付けするテキスト ファイルを指定することだけです。たとえば、String test = "this is a test";this_DT is_VBZ a_DT test_NN が返されます。

タガーを再トレーニングするにはどうすればよいですか? 上記の文字列を this_DT is_VBZ a_DT test_VB? として返したいとしましょう。

ここでの回答に感謝します。

0 投票する
1 に答える
526 参照

nlp - Penn Treebank の POS タグセットに「to」という単語用の別のタグがあるのはなぜですか?

Penn TreebankTOタグセットには、前置詞の意味 ( などI went to school) で使用されるか不定詞の意味 ( など)で使用されるかに関係なく、単語 'to'の個別のタグがありI want to eatます。NLP の全体的な観点から、これはどのような目的に役立ちますか? 不定詞 'to' を別々にタグ付けするだけでも直感的には理解できますが、不定詞と前置詞を 1 つのタグで組み合わせるロジックがわかりません。

ありがとうございます。これがスタック オーバーフローのガイドラインに適合しない場合はお詫び申し上げます。

0 投票する
2 に答える
4090 参照

opennlp - opennlp パーサー用の独自のトレーニング データを作成する方法

私は opennlp が初めてで、パーサーをカスタマイズするのに助けが必要です

事前にトレーニングされたモデル en-pos-maxtent.bin で opennlp パーサーを使用して、新しい生の英語の文に音声の対応する部分をタグ付けしました。タグをカスタマイズしたいと思います。

例文:犬が壁を飛び越えた。

en-pos-maxtent.bin を使用して POS タグを付けた後、結果は次のようになります。

犬 - NNP

ジャンプ - VBD

オーバー - イン

-DT

壁 - NN

しかし、私は自分のモデルをトレーニングし、次のようなカスタムタグで単語にタグを付けたいと思っています

犬 - PERP

ジャンプ - ACT

オーバー - OTH

-OTH

壁 - OBJ

ここで、PERP、ACT、OTH、OBJ は私の必需品に合うタグです。これは可能ですか?

ドキュメントのセクションを確認しました。モデルをトレーニングして後で使用するためのコードが提供されています。コードは次のようになります

この「en-pos.train」が何なのか理解できません。

このファイルの形式は何ですか? ここでカスタムタグを指定できますか、それともこのファイルとは正確には何ですか?

任意の助けをいただければ幸いです

ありがとう

0 投票する
0 に答える
252 参照

nlp - 単語の品詞のすべてのバリアントを取得する方法は?

POS タガーの知る限り、可能な品詞のバリエーションは 1 つしか表示されません。すべてのバリアントを提供するツールまたはライブラリ (できれば Python 用) はありますか?