問題タブ [pos-tagger]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
278 参照

c# - 一致に応じて正規表現を置き換える

私はいくつかの POS タグ分析に取り組んでおり、いくつかのタグを置き換える必要があります。タグを識別するために正規表現を使用しています。

// "/" と " " の間のすべて、サンプル タグ: /NN、/VB など...

今、タグ名を firstMatch グループに取得しているので、次のようにアクセスできます

私がやりたいのは、タグ名に応じて、タグ名を他のタグに置き換えることです。同様に、タグ名が DTI の場合、DT に置き換えたいと考えています。NNSならNNに置き換えたい。など、私が持っているタグのリストから。それをしてもいいですか?マッチリプレイスがあるかどうかを考えていたので、そのために使用できます。

ありがとう!

0 投票する
1 に答える
984 参照

java - OpenNLP のパーサー タグ

OpenNLP のパーサー タグの意味に関するドキュメントはありますか? POS タグの種類が TreeBank の規則に従っていることは知っていますが、残念ながら「SBAR」などのパーサー タグに関する情報は見つかりませんでした。

このドキュメントはどこかに存在しますか、それとも自分で把握する必要がありますか?

0 投票する
1 に答える
882 参照

linux - Stanford POS Tagger が中国語のテキストにタグを付けない

私は Stanford POS Tagger を (初めて) 使用しています。英語は正しくタグ付けされていますが、モデル パラメーターを変更しても (簡体字) 中国語は認識されないようです。私は何かを見落としましたか?

ここから最新のフルバージョンをダウンロードして解凍しました: http://nlp.stanford.edu/software/tagger.shtml

次に、「sample-input.txt」にサンプル テキストを入力しました。

</p>

それから私は単に実行します

./stanford-postagger.sh models/chinese-distim.tagger sample-input.txt

予想される出力は、各単語に品詞のタグを付けることですが、代わりに、テキストの文字列全体を 1 つの単語として認識します。

タガー models/chinese-distim.tagger からのデフォルト プロパティのロード

models/chinese-distim.tagger から POS タガー モデルを読み取り中 ... 完了 [3.5 秒]。

這是一個測試的句子。這是另一個句子。#NR

毎秒 30.30 ワードで 1 ワードをタグ付けしました。

助けていただければ幸いです。

0 投票する
0 に答える
401 参照

python - POSタグ 自分のコーパス

次のコードがあります

問題は、結果の各単語に「なし」という値が表示されることです..

そして、私がこのコードを持っているとき

結果は正しい...

何がうまくいかないのですか??

0 投票する
2 に答える
2175 参照

python - 語幹が付けられた単語から最も近い名詞を取得する

短いバージョン:
語幹のある単語がある場合:
Say 'comput' for 'computing', or 'sugari' for 'sugary'
最も近い名詞形を構築する方法はありますか?
That is 'computer', or 'sugar' respectively


より長いバージョン:
私は python と NLTK、Wordnet を使用して、一連の単語に対していくつかの意味的類似性タスクを実行しています。
ほとんどの sem-sim スコアは名詞に対してのみ有効であり、形容詞と動詞では結果が得られないことに気付きました。
関連する不正確さを理解して、単語を動詞/形容詞の形から名詞の形に変換したかったので、(通常形容詞で返される「NONE」の代わりに) 類似性の推定値を得ることができます。

これを行う 1 つの方法は、ステマーを使用してルート ワードを取得し、そのルートの最も近い名詞形を構築しようとすることだと思いました。ここ
からのGeorge-Bogdan Ivanovのアルゴリズムはかなりうまく機能します。別のアプローチを試してみたかったのです。単語を形容詞/動詞の形から名詞の形に変換するより良い方法はありますか?