問題タブ [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 結果を conll 形式で出力します (POS タグ付け、stanford pos tagger)
Stanford POS-tagger を使用しようとしています。英語のテキストを解析して (実際には pos タグだけで十分です)、結果を conll 形式で出力できるかどうかを尋ねたいと思います。そのようなオプションはありますか?
Stanford pos tagger の完全な 3.2.0 バージョンを使用しています
どうもありがとう
java - Eclipseでスタンフォードnlp pos taggerを再トレーニングする
私はnlpにかなり慣れていないので、posのタグ付けを理解しようとしています. 現在、スタンフォード nlp pos tagger を試しています。URL: http://nlp.stanford.edu/software/tagger.shtml
上記のリンクから、次の文があります。
タガーは、その言語の POS 注釈付きトレーニング テキストがあれば、任意の言語で再トレーニングできます。
しかし、私はそれを機能させることができません。今できることは、タグ付けするテキスト ファイルを指定することだけです。たとえば、String test = "this is a test";
this_DT is_VBZ a_DT test_NN が返されます。
タガーを再トレーニングするにはどうすればよいですか? 上記の文字列を this_DT is_VBZ a_DT test_VB? として返したいとしましょう。
ここでの回答に感謝します。
nlp - Penn Treebank の POS タグセットに「to」という単語用の別のタグがあるのはなぜですか?
Penn TreebankTO
タグセットには、前置詞の意味 ( などI went to school
) で使用されるか不定詞の意味 ( など)で使用されるかに関係なく、単語 'to'の個別のタグがありI want to eat
ます。NLP の全体的な観点から、これはどのような目的に役立ちますか? 不定詞 'to' を別々にタグ付けするだけでも直感的には理解できますが、不定詞と前置詞を 1 つのタグで組み合わせるロジックがわかりません。
ありがとうございます。これがスタック オーバーフローのガイドラインに適合しない場合はお詫び申し上げます。
opennlp - opennlp パーサー用の独自のトレーニング データを作成する方法
私は opennlp が初めてで、パーサーをカスタマイズするのに助けが必要です
事前にトレーニングされたモデル en-pos-maxtent.bin で opennlp パーサーを使用して、新しい生の英語の文に音声の対応する部分をタグ付けしました。タグをカスタマイズしたいと思います。
例文:犬が壁を飛び越えた。
en-pos-maxtent.bin を使用して POS タグを付けた後、結果は次のようになります。
犬 - NNP
ジャンプ - VBD
オーバー - イン
-DT
壁 - NN
しかし、私は自分のモデルをトレーニングし、次のようなカスタムタグで単語にタグを付けたいと思っています
犬 - PERP
ジャンプ - ACT
オーバー - OTH
-OTH
壁 - OBJ
ここで、PERP、ACT、OTH、OBJ は私の必需品に合うタグです。これは可能ですか?
ドキュメントのセクションを確認しました。モデルをトレーニングして後で使用するためのコードが提供されています。コードは次のようになります
この「en-pos.train」が何なのか理解できません。
このファイルの形式は何ですか? ここでカスタムタグを指定できますか、それともこのファイルとは正確には何ですか?
任意の助けをいただければ幸いです
ありがとう
nlp - 単語の品詞のすべてのバリアントを取得する方法は?
POS タガーの知る限り、可能な品詞のバリエーションは 1 つしか表示されません。すべてのバリアントを提供するツールまたはライブラリ (できれば Python 用) はありますか?