問題タブ [pos-tagger]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

569 問題

0 投票する

2 に答える

278 参照

c# - 一致に応じて正規表現を置き換える

私はいくつかの POS タグ分析に取り組んでおり、いくつかのタグを置き換える必要があります。タグを識別するために正規表現を使用しています。

// "/" と " " の間のすべて、サンプルタグ: /NN、/VB など...

今、タグ名を firstMatch グループに取得しているので、次のようにアクセスできます

私がやりたいのは、タグ名に応じて、タグ名を他のタグに置き換えることです。同様に、タグ名が DTI の場合、DT に置き換えたいと考えています。NNSならNNに置き換えたい。など、私が持っているタグのリストから。それをしてもいいですか？マッチリプレイスがあるかどうかを考えていたので、そのために使用できます。

ありがとう！

c#regex pos-tagger

2013-03-29T13:39:19.417

0 投票する

1 に答える

984 参照

java - OpenNLP のパーサータグ

OpenNLP のパーサータグの意味に関するドキュメントはありますか? POS タグの種類が TreeBank の規則に従っていることは知っていますが、残念ながら「SBAR」などのパーサータグに関する情報は見つかりませんでした。

このドキュメントはどこかに存在しますか、それとも自分で把握する必要がありますか?

java parsing nlp opennlp pos-tagger

2013-04-10T16:46:18.983

0 投票する

1 に答える

882 参照

linux - Stanford POS Tagger が中国語のテキストにタグを付けない

私は Stanford POS Tagger を (初めて) 使用しています。英語は正しくタグ付けされていますが、モデルパラメーターを変更しても (簡体字) 中国語は認識されないようです。私は何かを見落としましたか？

ここから最新のフルバージョンをダウンロードして解凍しました: http://nlp.stanford.edu/software/tagger.shtml

次に、「sample-input.txt」にサンプルテキストを入力しました。

</p>

それから私は単に実行します

./stanford-postagger.sh models/chinese-distim.tagger sample-input.txt

予想される出力は、各単語に品詞のタグを付けることですが、代わりに、テキストの文字列全体を 1 つの単語として認識します。

タガー models/chinese-distim.tagger からのデフォルトプロパティのロード

models/chinese-distim.tagger から POS タガーモデルを読み取り中 ... 完了 [3.5 秒]。

這是一個測試的句子。這是另一個句子。#NR

毎秒 30.30 ワードで 1 ワードをタグ付けしました。

助けていただければ幸いです。

linux nlp stanford-nlp pos-tagger

2013-04-18T04:00:16.210

0 投票する

0 に答える

401 参照

python - POSタグ自分のコーパス

次のコードがあります

問題は、結果の各単語に「なし」という値が表示されることです..

そして、私がこのコードを持っているとき

結果は正しい...

何がうまくいかないのですか??

python nltk pos-tagger

2013-04-29T09:08:01.327

0 投票する

2 に答える

2175 参照

python - 語幹が付けられた単語から最も近い名詞を取得する

短いバージョン:
語幹のある単語がある場合:
Say 'comput' for 'computing', or 'sugari' for 'sugary'
最も近い名詞形を構築する方法はありますか?
That is 'computer', or 'sugar' respectively

より長いバージョン:
私は python と NLTK、Wordnet を使用して、一連の単語に対していくつかの意味的類似性タスクを実行しています。
ほとんどの sem-sim スコアは名詞に対してのみ有効であり、形容詞と動詞では結果が得られないことに気付きました。
関連する不正確さを理解して、単語を動詞/形容詞の形から名詞の形に変換したかったので、(通常形容詞で返される「NONE」の代わりに) 類似性の推定値を得ることができます。

これを行う 1 つの方法は、ステマーを使用してルートワードを取得し、そのルートの最も近い名詞形を構築しようとすることだと思いました。ここ
からのGeorge-Bogdan Ivanovのアルゴリズムはかなりうまく機能します。別のアプローチを試してみたかったのです。単語を形容詞/動詞の形から名詞の形に変換するより良い方法はありますか?

python nltk wordnet stemming pos-tagger

2013-06-13T09:19:04.487

1 2 3 4 5 6 7 8 9 10

問題タブ [pos-tagger]

c# - 一致に応じて正規表現を置き換える

java - OpenNLP のパーサー タグ

linux - Stanford POS Tagger が中国語のテキストにタグを付けない

python - POSタグ 自分のコーパス

python - 語幹が付けられた単語から最も近い名詞を取得する

Reference

java - OpenNLP のパーサータグ

python - POSタグ自分のコーパス