問題タブ [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 一致に応じて正規表現を置き換える
私はいくつかの POS タグ分析に取り組んでおり、いくつかのタグを置き換える必要があります。タグを識別するために正規表現を使用しています。
// "/" と " " の間のすべて、サンプル タグ: /NN、/VB など...
今、タグ名を firstMatch グループに取得しているので、次のようにアクセスできます
私がやりたいのは、タグ名に応じて、タグ名を他のタグに置き換えることです。同様に、タグ名が DTI の場合、DT に置き換えたいと考えています。NNSならNNに置き換えたい。など、私が持っているタグのリストから。それをしてもいいですか?マッチリプレイスがあるかどうかを考えていたので、そのために使用できます。
ありがとう!
java - OpenNLP のパーサー タグ
OpenNLP のパーサー タグの意味に関するドキュメントはありますか? POS タグの種類が TreeBank の規則に従っていることは知っていますが、残念ながら「SBAR」などのパーサー タグに関する情報は見つかりませんでした。
このドキュメントはどこかに存在しますか、それとも自分で把握する必要がありますか?
linux - Stanford POS Tagger が中国語のテキストにタグを付けない
私は Stanford POS Tagger を (初めて) 使用しています。英語は正しくタグ付けされていますが、モデル パラメーターを変更しても (簡体字) 中国語は認識されないようです。私は何かを見落としましたか?
ここから最新のフルバージョンをダウンロードして解凍しました: http://nlp.stanford.edu/software/tagger.shtml
次に、「sample-input.txt」にサンプル テキストを入力しました。
</p>
それから私は単に実行します
./stanford-postagger.sh models/chinese-distim.tagger sample-input.txt
予想される出力は、各単語に品詞のタグを付けることですが、代わりに、テキストの文字列全体を 1 つの単語として認識します。
タガー models/chinese-distim.tagger からのデフォルト プロパティのロード
models/chinese-distim.tagger から POS タガー モデルを読み取り中 ... 完了 [3.5 秒]。
這是一個測試的句子。這是另一個句子。#NR
毎秒 30.30 ワードで 1 ワードをタグ付けしました。
助けていただければ幸いです。
python - POSタグ 自分のコーパス
次のコードがあります
問題は、結果の各単語に「なし」という値が表示されることです..
そして、私がこのコードを持っているとき
結果は正しい...
何がうまくいかないのですか??
python - 語幹が付けられた単語から最も近い名詞を取得する
短いバージョン:
語幹のある単語がある場合:
Say 'comput' for 'computing', or 'sugari' for 'sugary'
最も近い名詞形を構築する方法はありますか?
That is 'computer', or 'sugar' respectively
より長いバージョン:
私は python と NLTK、Wordnet を使用して、一連の単語に対していくつかの意味的類似性タスクを実行しています。
ほとんどの sem-sim スコアは名詞に対してのみ有効であり、形容詞と動詞では結果が得られないことに気付きました。
関連する不正確さを理解して、単語を動詞/形容詞の形から名詞の形に変換したかったので、(通常形容詞で返される「NONE」の代わりに) 類似性の推定値を得ることができます。
これを行う 1 つの方法は、ステマーを使用してルート ワードを取得し、そのルートの最も近い名詞形を構築しようとすることだと思いました。ここ
からのGeorge-Bogdan Ivanovのアルゴリズムはかなりうまく機能します。別のアプローチを試してみたかったのです。単語を形容詞/動詞の形から名詞の形に変換するより良い方法はありますか?