問題タブ [pos-tagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
4895 参照

python - backoff ngrams を使用した nltk での pos のタグ付け

nltk で品詞 (または POS) タガーを作成しようとしましたが、バックオフを使用して一度に複数の ngram タガーで動作させることができません。より高いスコアを得るために、より多くのタガーを使用していると読みましたが、私にはうまくいきません。最初はより多くの単語を使用し、次に使用する単語を 1 つに減らしたいと考えています。こんな感じでやってみたのですが、

しかし、エラー AttributeError: 'generator' object has no attribute 'tag' が表示されます

だから私はリストなしでそれを作ります:

しかし、私は得る:

私はPythonを初めて使用するので、助けていただければ幸いです。

0 投票する
2 に答える
2355 参照

nltk - 英語でのPOSタグ付けのためにNLTKでHunposタガーを正しく設定するには?

従来の NLTK の代わりに NLTK を使用した POS タグ付けにHunpos タガーを使用しようとしていますpos_tag()が、バイナリenglish.modelまたはen_wsj.model.

実際、私はLinux Mintにいて、それらを に入れ/usr/local/bin、環境変数をこのパスに設定し、このパスをofファイルで使用されるHUNPOSパラメーターに渡そうとしましたが、ファイルを認識すると、このエラーがスローされます:path_to_bin__init__nltk/tag/hunpos.py

何が起こっているのか誰にもわかりませんか?

0 投票する
1 に答える
260 参照

java - 複数のバッチ ファイルを同時に実行するための共有メモリを作成する

さまざまなファイルのバッチ ファイルを使用してタガーを実行しようとしています。これは私のコードです:

これは処理に時間がかかり、私の PC は数回ハングします。タガーが一度だけロードできるように共有メモリを作成したいのですが、すべてのバッチファイルがその共有タガーを使用します。毎回タガーをロードするべきではありません。これどうやってするの?

0 投票する
1 に答える
234 参照

stanford-nlp - stanford pos tagger の使用中に複数形を削除する

Stanford tagger を使用して、複数形を単数形 (例: 女の子から女の子) に置き換えようとしています。

私は正しくやっていますか?

0 投票する
2 に答える
1811 参照

java - スタンフォード POS タグ付け: 単数名詞 (NN) としてタグ付けされた単語を取得する

出力:

Q:単数名詞 (NN) としてタグ付けされているため、上記のプログラムの出力として boy を出力する必要があります