問題タブ [part-of-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
8 に答える
7282 参照

nlp - NLP で固有名詞を認識するための戦略

自然言語処理(NLP)についてもっと学ぶことに興味があります。現在、辞書認識に基づかないテキスト内の固有名詞を認識する方法があるかどうか知りたいです。また、現在の辞書ベースの方法を説明するリソースを説明したり、リンクしたりできますか? NLP の権威ある専門家は誰ですか、またはこのテーマに関する決定的なリソースは何ですか?

0 投票する
10 に答える
100845 参照

java - JavaスタンフォードNLP:品詞ラベル?

ここでデモされたStanfordNLPは、次のような出力を提供します。

品詞タグとはどういう意味ですか?公式リストが見つかりません。それはスタンフォード独自のシステムですか、それともユニバーサルタグを使用していますか?(JJたとえば、何ですか?)

また、たとえば名詞を探して文を繰り返し処理していると、タグが付いているかどうかを確認するようなことをすることになります.contains('N')。これはかなり弱いと感じます。プログラムで品詞を検索するためのより良い方法はありますか?

0 投票する
2 に答える
1774 参照

nlp - 変換ベースの品詞タグ付け (Brill Tagging)

Brill Tagger の弱点と長所は何ですか? タガーの改善案をいくつか提案していただけますか?

0 投票する
2 に答える
283 参照

perl - さらに処理するためにベース名を保持しながら、複数のファイルをループするにはどうすればよいですか?

トークン化する必要がある複数のテキスト ファイル、POS および NER があります。私はC&Cタガーを使用しており、そのチュートリアルを実行しましたが、1 つずつではなく複数のファイルにタグを付ける方法があるかどうか疑問に思っています。

現時点では、ファイルをトークン化しています:

次のように、品詞のタグ付けを行います。

最後に固有表現認識:

これを行うためにループを作成し、ファイル名を入力と同じに保ちますが、拡張子はタグ付けを表す方法がわかりません。ディレクトリを開くために bash スクリプトまたはおそらく Perl を考えていましたが、スクリプトが理解するために C&C コマンドを入力する方法がわかりません。

現時点では手動で行っていますが、控えめに言ってもかなり時間がかかります!

0 投票する
1 に答える
4288 参照

machine-learning - 品詞 (POS) タグ テキスト分類のための特徴選択

Stanford POS tagger を使って POS タグ文を取得してもらいました。例えば:

/ DT島 / NN だった / VBD とても / RB 綺麗 / JJ . /. I/PRP 愛/VBP それ/PRP ./.

(xml形式も可)

この POS タグの文章から特徴選択を行い、機械学習手法を使用してテキスト分類用の特徴ベクトルに変換する方法を説明できる人はいますか。

0 投票する
2 に答える
4144 参照

python - 機能語の頻度を計算する

Python/NLTKで機能語の頻度を計算したいと思います。私はそれについて2つの方法があります:

  • 品詞タガーを使用して、機能する単語を構成する POS タグを要約します。
  • 機能語のリストを作成し、簡単な検索を実行する

最初のケースの問題点は、データにノイズがあり、どの POS タグが機能語として構成されているか (確かに) わからないことです。2 番目のケースの問題点は、リストがなく、データにノイズがあるため、ルックアップが正確ではないことです。

私は、より正確な結果をもたらす2番目または他の例よりも最初の例を好みます。

0 投票する
2 に答える
1930 参照

objective-c - C/C++/Obj-C の品詞タグ付けと固有表現認識

助けが要る!

私は、品詞のタグ付けを必要とし、理想的には名前付きエンティティ認識も必要とする目的の c でいくつかのコードを記述しようとしています。私は「自分で作る」ことにあまり興味がないので、この目的に使用できるまともなライブラリを探しています。明らかに正確であればあるほど良いのですが、ここでは重要なことを話しているわけではありません。一般的にかなり正確である限り、それで十分です。

少なくとも当分の間は英語のみになりますが、モデルのトレーニングを自分で行う必要はありません。したがって、どのようなソリューションであっても、英語モデルが既に構築されている必要があります。

そして最後に、商用に適したライセンス (BSD/Berkeley、LGPL など) で利用できる必要があります。GPL やそのような制限的なことはできませんが、それが唯一の選択肢である場合は、商用ライセンスに少額を支払うことにオープンです。

C、C++、または Obj-C コードはすべて問題ありません。

だから:ここでトリックを行う何かに精通している人はいますか?ありがとう!!

0 投票する
1 に答える
300 参照

nlp - CLAWS7 タグを Penn タグに変換するにはどうすればよいですか?

タグをCLAWS7タグセットからPennタグセットの同等のものに変換する方法を知っている人はいますか?

CLAWS7 タグセット: http://ucrel.lancs.ac.uk/claws7tags.html

ペン タグセット: http://www.mozart-oz.org/mogul/doc/lager/brill-tagger/penn.html

0 投票する
1 に答える
283 参照

nlp - 文、単語、品詞などにラベルを付けるためのマイクロフォーマットはありますか

文、単語、品詞などのタグを持つ基本的な自然言語プロセスのマイクロフォーマットはありますか?Webを検索しましたが、見つかりませんでした。

0 投票する
2 に答える
3326 参照

python - NLTK を使用したドイツ語テキストの POS タグ付け

ドイツ語のテキストのタグ付けに NLTK を使用したいと思います。この質問このプロジェクトを見つけました。どちらも非常に複雑に見え、pos tagger のトレーニング方法に関する NLTK ドキュメントが見つかりません。ヒントはありますか?ドイツ語のテキストを入力してタグ付きの単語を取得する最も簡単な方法を探しています。ヒントはありますか?