問題タブ [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 品詞タガー (POS タガー) を作成する
Java で POS タガーを構築する必要があり、開始方法を知る必要があります。POS タガーの仕組みを説明するのに役立つコード例やその他のリソースはありますか?
python - NLTK pos タグを使用してより良い結果を得る方法
私はPythonを使ってnltkを学んでいます。いろいろな文章で pos_tag をやってみました。しかし、得られた結果は正確ではありません。結果を即興で処理するにはどうすればよいですか?
また、NN として分類されている余分な単語がたくさんあります。これらを除外してより良い結果を得るにはどうすればよいですか?
machine-learning - テキストからアクションを抽出するためのNLP
誰かが私を正しい方向に向けて、一連のテキストからアクションを分離することについて学ぶことができることを願っています。
私がこのテキストを持っているとしましょう
私はそれを分割させようとしています
特にアクションベースの検索では、何も見つかりませんでした。たとえば、2番目の項目に「go」、「pick-up」、「get」があるなど、1つのアクションに関連付けられることがある複数の動詞があるため、動詞を選択するよりも賢くする必要がありますが、それはすべて一部です単一のアクションの。もちろん、「ティムの飛行」は、動詞がセグメントの終わりに向かってくる、現在分詞での行動を示唆するだけです。
この種のことをどこで行うべきかについての提案はありますか?注意点、推奨読書など。
nlp - バウムウェルチアルゴリズムの実装のデバッグ(品詞タグ付け用)
私はプロジェクトに取り組んでおり、その一部はPOSタグ付け用の教師なしHMMトレーナーを開発することであり、現在、可能性のあるバグをテストしたいと考えています。
モデルのトレーニングにバウムウェルチアルゴリズムを使用しています。入力は(コーパスから抽出された)シーケンスワードであり、出力は一連の状態からの非表示状態のシーケンスです(s1, s2, ... sn)
。これでコーディングは完了しましたが、バグがないかどうかはわかりません。
誰かが私にいくつかのデバッグのアイデアを提案できますか?何のように出力をチェックインする必要がありますか?アルゴリズムの精度を確認するにはどうすればよいですか?
python - TopiaTermExtract-イタリア語辞書
テキストからトピックキーワードを抽出するツールを探しています。Topiaは良い解決策のようですが、とにかくイタリア語の辞書ファイルは付属していません。
Webで検索すると、プリコンパイルされたファイルが見つからなかったので、自分で作成する必要があると思います。誰かが一生を費やすことなくそれを構築する方法についての提案がありますか?
英語のファイルは次のようにフォーマットされています。
アドバイスをよろしくお願いします。
python - ダウンロードを要求する NLTK POS タガーとは何ですか?
品詞タガーを使い始めたばかりですが、多くの問題に直面しています。
次のようにPOSタグ付けを開始しました。
を印刷したい場合'text'
、次のことが起こります。
使用nltk.download()
しましたが、うまくいきませんでした。
c# - C#コードでpython NLP POS taggerを使用するには?
問題は、私のコードが C# であり、適切な c# pos tagger が見つからなかったため、python pos tagger を使用したことです。これを使用する方法がわかりません。私のC#コードのPython NLP POSタガー.誰かが私を案内してくれますか?また、C# POSタガーを提案してください.Thankx
編集: Python NLP POS tagger を使用する
ために IronPython を使用することを考えました
。import nltk
ImportError:No module named nltk
nlp - POS タグ付けと浅い解析の違いは何ですか?
私は現在、大学で自然言語処理のコースを受講していますが、基本的な概念についてまだ混乱しています。Foundations of Statistical Natural Language Processing本から POS タグ付けの定義を取得します。
タグ付けは、文中の各単語に適切な品詞を付けてラベルを付ける (またはタグ付けする) タスクです。各単語が名詞、動詞、形容詞などのいずれであるかを判断します。
しかし、この本には、POS タグ付けのユーティリティの 1 つとして浅い解析も記述されているため、浅い解析の定義を見つけることができません。だから私はウェブを検索し始めましたが、浅い解析の直接的な説明は見つかりませんでしたが、ウィキペディアでは:
浅い解析 (チャンキング、「軽い解析」とも呼ばれる) は、構成要素 (名詞グループ、動詞、動詞グループなど) を識別する文の分析ですが、それらの内部構造や主文での役割は指定しません。
率直に言って違いはわかりませんが、英語のせいか、単純な基本概念を理解していないだけかもしれません。浅い解析とPOSタグ付けの違いを誰か説明してもらえますか? 浅い解析はしばしば浅い意味解析とも呼ばれますか?
前にありがとう。
php - PHP の Pos Tagger
PHP で使用できる pos-tagger を探しています。または、PHP で Qtag Java アプリの結果を使用する方法があるかどうかを知る必要があります。
java - POS タガーのタグを削除
文章からタグを削除することはできますか? ファイルをスキャンしてタグを見つけて削除することでそれを達成できますが、多くのタグがあるため (一部のモデルには 30 以上のタグがあり、一部のモデルには約 48 ~ 50 のタグがあり、基本的にpenn treebank の pos タグに従います)、速い方法はありますか?より効率的な方法でタグを削除する甘い方法はありますか? APIを確認しましたが、タグを削除する方法はありませんでした。