問題タブ [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - backoff ngrams を使用した nltk での pos のタグ付け
nltk で品詞 (または POS) タガーを作成しようとしましたが、バックオフを使用して一度に複数の ngram タガーで動作させることができません。より高いスコアを得るために、より多くのタガーを使用していると読みましたが、私にはうまくいきません。最初はより多くの単語を使用し、次に使用する単語を 1 つに減らしたいと考えています。こんな感じでやってみたのですが、
しかし、エラー AttributeError: 'generator' object has no attribute 'tag' が表示されます
だから私はリストなしでそれを作ります:
しかし、私は得る:
私はPythonを初めて使用するので、助けていただければ幸いです。
nltk - 英語でのPOSタグ付けのためにNLTKでHunposタガーを正しく設定するには?
従来の NLTK の代わりに NLTK を使用した POS タグ付けにHunpos タガーを使用しようとしていますpos_tag()
が、バイナリenglish.model
またはen_wsj.model
.
実際、私はLinux Mintにいて、それらを に入れ/usr/local/bin
、環境変数をこのパスに設定し、このパスをofファイルで使用されるHUNPOS
パラメーターに渡そうとしましたが、ファイルを認識すると、このエラーがスローされます:path_to_bin
__init__
nltk/tag/hunpos.py
何が起こっているのか誰にもわかりませんか?
java - 複数のバッチ ファイルを同時に実行するための共有メモリを作成する
さまざまなファイルのバッチ ファイルを使用してタガーを実行しようとしています。これは私のコードです:
これは処理に時間がかかり、私の PC は数回ハングします。タガーが一度だけロードできるように共有メモリを作成したいのですが、すべてのバッチファイルがその共有タガーを使用します。毎回タガーをロードするべきではありません。これどうやってするの?
stanford-nlp - stanford pos tagger の使用中に複数形を削除する
Stanford tagger を使用して、複数形を単数形 (例: 女の子から女の子) に置き換えようとしています。
私は正しくやっていますか?
java - スタンフォード POS タグ付け: 単数名詞 (NN) としてタグ付けされた単語を取得する
出力:
Q:単数名詞 (NN) としてタグ付けされているため、上記のプログラムの出力として boy を出力する必要があります