問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - NLP で固有名詞を認識するための戦略
自然言語処理(NLP)についてもっと学ぶことに興味があります。現在、辞書認識に基づかないテキスト内の固有名詞を認識する方法があるかどうか知りたいです。また、現在の辞書ベースの方法を説明するリソースを説明したり、リンクしたりできますか? NLP の権威ある専門家は誰ですか、またはこのテーマに関する決定的なリソースは何ですか?
java - JavaスタンフォードNLP:品詞ラベル?
ここでデモされたStanfordNLPは、次のような出力を提供します。
品詞タグとはどういう意味ですか?公式リストが見つかりません。それはスタンフォード独自のシステムですか、それともユニバーサルタグを使用していますか?(JJ
たとえば、何ですか?)
また、たとえば名詞を探して文を繰り返し処理していると、タグが付いているかどうかを確認するようなことをすることになります.contains('N')
。これはかなり弱いと感じます。プログラムで品詞を検索するためのより良い方法はありますか?
nlp - 変換ベースの品詞タグ付け (Brill Tagging)
Brill Tagger の弱点と長所は何ですか? タガーの改善案をいくつか提案していただけますか?
perl - さらに処理するためにベース名を保持しながら、複数のファイルをループするにはどうすればよいですか?
トークン化する必要がある複数のテキスト ファイル、POS および NER があります。私はC&Cタガーを使用しており、そのチュートリアルを実行しましたが、1 つずつではなく複数のファイルにタグを付ける方法があるかどうか疑問に思っています。
現時点では、ファイルをトークン化しています:
次のように、品詞のタグ付けを行います。
最後に固有表現認識:
これを行うためにループを作成し、ファイル名を入力と同じに保ちますが、拡張子はタグ付けを表す方法がわかりません。ディレクトリを開くために bash スクリプトまたはおそらく Perl を考えていましたが、スクリプトが理解するために C&C コマンドを入力する方法がわかりません。
現時点では手動で行っていますが、控えめに言ってもかなり時間がかかります!
machine-learning - 品詞 (POS) タグ テキスト分類のための特徴選択
Stanford POS tagger を使って POS タグ文を取得してもらいました。例えば:
/ DT島 / NN だった / VBD とても / RB 綺麗 / JJ . /. I/PRP 愛/VBP それ/PRP ./.
(xml形式も可)
この POS タグの文章から特徴選択を行い、機械学習手法を使用してテキスト分類用の特徴ベクトルに変換する方法を説明できる人はいますか。
python - 機能語の頻度を計算する
Python/NLTKで機能語の頻度を計算したいと思います。私はそれについて2つの方法があります:
- 品詞タガーを使用して、機能する単語を構成する POS タグを要約します。
- 機能語のリストを作成し、簡単な検索を実行する
最初のケースの問題点は、データにノイズがあり、どの POS タグが機能語として構成されているか (確かに) わからないことです。2 番目のケースの問題点は、リストがなく、データにノイズがあるため、ルックアップが正確ではないことです。
私は、より正確な結果をもたらす2番目または他の例よりも最初の例を好みます。
objective-c - C/C++/Obj-C の品詞タグ付けと固有表現認識
助けが要る!
私は、品詞のタグ付けを必要とし、理想的には名前付きエンティティ認識も必要とする目的の c でいくつかのコードを記述しようとしています。私は「自分で作る」ことにあまり興味がないので、この目的に使用できるまともなライブラリを探しています。明らかに正確であればあるほど良いのですが、ここでは重要なことを話しているわけではありません。一般的にかなり正確である限り、それで十分です。
少なくとも当分の間は英語のみになりますが、モデルのトレーニングを自分で行う必要はありません。したがって、どのようなソリューションであっても、英語モデルが既に構築されている必要があります。
そして最後に、商用に適したライセンス (BSD/Berkeley、LGPL など) で利用できる必要があります。GPL やそのような制限的なことはできませんが、それが唯一の選択肢である場合は、商用ライセンスに少額を支払うことにオープンです。
C、C++、または Obj-C コードはすべて問題ありません。
だから:ここでトリックを行う何かに精通している人はいますか?ありがとう!!
nlp - CLAWS7 タグを Penn タグに変換するにはどうすればよいですか?
タグをCLAWS7タグセットからPennタグセットの同等のものに変換する方法を知っている人はいますか?
CLAWS7 タグセット: http://ucrel.lancs.ac.uk/claws7tags.html
ペン タグセット: http://www.mozart-oz.org/mogul/doc/lager/brill-tagger/penn.html
nlp - 文、単語、品詞などにラベルを付けるためのマイクロフォーマットはありますか
文、単語、品詞などのタグを持つ基本的な自然言語プロセスのマイクロフォーマットはありますか?Webを検索しましたが、見つかりませんでした。