問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - スタンフォードの品詞タガーは、事前にトークン化されたテキストの括弧と引用符にタグを付けることができません
スタンフォードの品詞タガーへの入力として、事前にトークン化されたテキストがあります。括弧や引用符を正しくタグ付けできません。Stanford Tagger のデフォルトのトークン化はしたくないので、-tokenize false
オプションを使用して無効にしました。
スタンドアロンの Stanford Parserでサポートされている括弧をandに変換するなど、トークン化中に がescape characters
行う方法を知っています。Penn Treebank
-LRB-
-RRB-
スタンフォードの品詞タガーでうまく処理する方法はありますか?
java - Stanford POS tagger からのログ メッセージを無効にするにはどうすればよいですか?
Stanford POS tagger で注釈を付けるテキストが約 400 万あります。これらのログ メッセージを無効にするにはどうすればよいですか。
ログファイルにこれらの 400 万は必要ありません。
stanford-nlp - スタンフォードの NLP ライブラリを使用して POS タグと NER タグの両方を生成できる複合モデルはありますか?
サンプル テキスト出力の例を次に示します 。Good/NNP 午後/NNP Rajat/PERSON Raina/PERSON,/O how/WRB are/VBP you/PRP today/NN ?/O
python - 品詞タグ付けとエンティティ認識 - python
RのopenNLPのMaxent_POS_Tag_AnnotatorおよびMaxent_Entity_Annotator関数と同様に、Pythonで品詞タグ付けとエンティティ認識を実行したい.入力をテキスト文として受け取り、「CC」の数のようなさまざまな機能として出力を与えるPythonのコードを好む、「CD」の番号、「DT」の番号など。 CC、CD、DT は Penn Treebank で使用されている POS タグです。したがって、 Penn Treebank POSのように 36 の POS タグに対応する POS タグ付けには 36 の列/機能が必要です。これを Azure ML の「Python スクリプトの実行」モジュールに実装したいのですが、Azure ML は python 2.7.7 をサポートしています。Pythonのnltkがうまくいくと聞きましたが、私はPythonの初心者です。どんな助けでも大歓迎です。
nlp - ドキュメント分類のための NLP テクニック?
ドキュメント分類のための NLP 手法があるかどうか疑問に思っていました。品詞のタグ付けによる n-gram の統計が役立つかどうか疑問に思っていました。このトピックに関する文献はあまり見つけられないようです..
ドキュメント分類の取り組みを強化する nlp 手法を見つけた人はいますか? このトピックに関する調査を知っていれば、それは素晴らしいことです。
ノート。私はこの質問を見ましたが、私のコーパスは大きすぎて、そこにある唯一の解決策は実用的ではありません.