問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 品詞タグ付け(POS Tagging)の用途・応用
私は品詞タグ付けの暗黙の価値を理解しており、解析やテキストから音声への変換などでの使用についての言及を見てきました.
PoS タガーの出力形式を教えてください。また、そのような出力が NLP システムの他のタスク/部分でどのように使用されているか説明していただけますか?
machine-learning - 品詞タガーの学習データはどこで入手できますか?
品詞タガーを実装したいのですが、大量の学習データをどこで入手できるかわかりません。ありがとう!
python - Stemmer と pos Tagger の優先順位について混乱しています
そのため、テキストコーパスを分析していて、トークン化されたすべての単語にステマーを使用しました。しかし、コーパス内のすべての名詞も見つけなければならないので、もう一度やりましたnltk.pos_tag(stemmed_sentence)
。
また
私は方法Aに従いましたが、pos_taggingを達成する正しい方法について混乱しています。
python - リストのサブ項目を比較して Python で変更する
次のような品詞タガーに由来する 2 つのリストがあります。
pos_names のリスト アイテムで pos_tags を更新する最終的なリストを作成したいと考えています。したがって、基本的には、pos_tags で John と Murphy を見つけて、POS タグを NNP に置き換える必要があります。
python - タプル要素によるタプルのリスト?
品詞の pos パターンの一致に問題があります。NN + IN + NN、VBG + IN + NN、ADJ + IN + NN などの前置詞句パターンの規則がありました。
アイデアは、任意の文からパターンを抽出し、上記の定義ルールと一致させ、一致した場合は True を返すことです。
文から抽出した例: sent_pos = [('increasing', 'VBG'), ('of', 'IN'), ('mutation', 'NN')] いずれかのルールに一致1 = [('', 'VBG' '), ('', 'IN'), ('', 'NN')] または rule2 = [('', 'NN'), ('', 'IN'), ('', 'NN' )] または [('', 'ADJ'), ('', 'IN'), ('', 'NN')]
結果は True を返します。
Pythonコードで可能ですか?
お返事ありがとうございます。
lucene - lucene による品詞検索
多くのグーグル検索の後、誰かが私を助けてくれることを期待して、ここに問題を投稿することにしました。私が達成したいのは、次のようにクエリを実行することです。
より一般的な形で、私が欲しいのは
そのために、次のようにタグ付けされたテキストがあります。
私が最初に考えたのは、各用語の追加情報をペイロードとしてインデックス化し、その後、各スパンのペイロードにアクセスするために PayloadNearQuery を使用することでした。問題は、PayloadNearQuery が最初に用語に一致してからそのペイロードにアクセスするため、上記の 3 つのクエリのいずれも機能しないことです。(間違っていたら訂正してください)
私が考えた2番目のことは、余分な情報を用語の同義語として索引付けすることでしたが、この方法では、最初の用語がadjであり、特定の単語「茶色」であるかどうかを同時に尋ねることができないため、2番目のクエリは機能しません.
この問題に対処する方法、提案などをいただければ幸いです。