問題タブ [pos-tagger]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - c/c++ NLP ライブラリ
私は c/c++ 用のオープン ソースの自然言語処理ライブラリを探しています。特に、品詞のタグ付けに興味があります。
java - JavaのスタンフォードPOSタガー
私はこれを試しています:
それは私に与えます:
エラー:\ u \ nlp \ data \ pos-tagger \ wsj3t0-18-left3words \ left3words-wsj-0-18.tagger(システムは指定されたパスを見つけることができません)
私はスタンフォードのPOSタガーを使用しています。
この問題を克服するために何ができますか?
java - JavaでStanfordpostaggerを使用して、java.lang.IncompatibleClassChangeErrorを取得します
スタンフォードNLP品詞タガーを初期化しようとしていますが、java.lang.IncompatibleClassChangeErrorが発生し続けます。エラーの原因を出力するとnullになり、メッセージを出力するとImplementingClassが表示されます。
これは私のコードです:
誰かがこれを修正する方法を知っていますか?
c# - SharpNLP の POS タガー
POS のタグ付けに SharpNLP を使用しています。
タグは3つしかありません。Penn ツリーバンクまたは他のタグ付けツリーバンクのセットをロードして使用するにはどうすればよいですか?
ありがとう
:)
parsing - HPSG PET パーサーを使用しようとしています
こんにちは、私はPETパーサーを使用しようとしていますが、使用方法に関するドキュメントが不十分です。PET の使用に関する優れた記事やチュートリアルを教えてもらえますか? utf-8に対応していますか?
parsing - 速くて汚いテキスト/文法パーサーを知っている人はいますか?
私がしたい「マッドライブラリ」シナリオがあります
a) 文中のすべての (またはほとんどの) 単語の品詞を決定する
b) ユーザーにそれらの単語の代替案を選択させるか、計算によって同等の単語に置き換える
私はスタンフォードパーサーを見ましたが、少し遅いです...何か提案はありますか?
python - MEGAMをNLTKClassifierBasedPOSTaggerとして使用しようとしていますか?
私は現在、NLTKを使用して汎用(または実用的な範囲で)POSタガーを構築しようとしています。トレーニングのためにブラウンとツリーバンクのコーパスに手を出しましたが、おそらくツリーバンクのコーパスに落ち着くでしょう。
学習しながら、分類子POSタガーが最も正確であることがわかりました。Maximum Entity分類器は最も正確であることが意図されていますが、非常に多くのメモリ(および処理時間)を使用するため、トレーニングデータセットを大幅に削減する必要があるため、デフォルトの単純ベイズ分類器を使用するよりも最終結果の精度が低くなります。
MEGAMを使用することをお勧めします。NLTKはMEGAMをある程度サポートしていますが、私が見つけたすべての例は、より具体的なPOSタガーではなく、一般的な分類子(たとえば、単語の特徴のベクトルを使用するテキスト分類子)を対象としています。独自のPOS特徴抽出器とコンパイラーを再作成する必要はありません(つまり、すでにNLTKにあるものを使用することを好みます)。MEGAMMaxEnt分類器をどのように使用できますか?つまり。次の行に沿っている既存のMaxEntコードにドロップするにはどうすればよいですか?
r - テキストから名詞+名詞または(adj|名詞)+名詞を抽出する
RパッケージのopenNLPで名詞+名詞または(adj|名詞)+名詞を抽出できるか問い合わせたいのですが?やり方を教えていただけますか?どうもありがとう。
回答ありがとうございます。コードは次のとおりです。
リーダーは、 acqTagSplitのインデックスを参照して、名詞 + 名詞または (adj|名詞) + 名詞の抽出を行うことができます。(コードは最適ではありませんが動作します。何かアイデアがあれば教えてください。)
さらに、私にはまだ問題があります。
Justeson と Katz (1995) は、名詞句の候補を抽出する別の言語フィルタリングを提案しました。
((Adj|名詞)+|((Adj|名詞) (名詞-プレップ)?)(Adj|名詞) )名詞
その意味がよく理解できません。それを説明するか、そのような表現をR言語に変換してください。どうもありがとう。
python - nltkでテキストファイルにhunposのタグを付けるにはどうすればよいですか?
誰かがnltkのコーパスにタグを付けるhunposの構文を手伝ってもらえますか?
hunpos.HunPosTagger
モジュールに何をインポートしますか?コーパスにHunPosTagを付けるにはどうすればよいですか?以下のコードを参照してください。
python - nltk で hunpos ラッパー クラスを設定する方法を知っている人はいますか?
次のコードを試し、http://code.google.com/p/hunpos/downloads/listからインストールしました
英語-wsj-1.0
hunpos-1.0-linux.tgz
ファイルを「~/」ディレクトリに抽出しました
そして、次のpythonコードを試したとき:
次のエラーが表示されます
Pythonでhunposを設定するにはどうすればよいですか? どの python コマンドを入力する必要がありますか?