問題タブ [part-of-speech]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

183 問題

0 投票する

1 に答える

98 参照

regex - 構文パターンと正規表現パターンを組み合わせて文字列を検索する

R を使用して、POS と実際の文字列を組み合わせて表現されたパターンをテキストから検索したいと考えています。(私はこの機能をPythonライブラリで見ました: http://www.clips.ua.ac.be/pages/pattern-search )。

たとえば、検索パターンは:'NOUNPHRASE be|is|was ADJECTIVE than NOUNPHRASE'であり、「猫は犬よりも速い」のような構造を含むすべての文字列を返す必要があります。

私は、パッケージが便利な POS タグ付けを好みopenNLP、提供していることを知っています。qdapこの種のパターンマッチングにその出力を使用している人はいますか?

regex r nlp tm part-of-speech

2015-03-30T08:17:33.663

0 投票する

2 に答える

933 参照

nlp - 品詞パターンを見つけるために使用できるツール

ドキュメントのコーパスで品詞パターンを見つけるためのツールを探しています。ドキュメントの POS タグ付けにスタンフォード NLP ツールを使用しています。これらのタグ付きドキュメントをクエリして、たとえば次のような特定の POS パターンを見つけたいと思います。

NPはJJ (例: 映画はいいです)

またはJJ NP (例: 素晴らしいフォアグラ)

シンプルで効率的な方法でこれを行うことができるツールはありますか、それとも自分で作成する必要がありますか?

nlp stanford-nlp part-of-speech

2015-04-07T15:40:58.863

0 投票する

1 に答える

467 参照

java - Apache OpenNLP 品詞タガー: どのデータセットでトレーニングされましたか?

テキストのコレクションで単語クラスを認識するために、Apache OpenNLP 品詞タガーを使用しています。タガーのパフォーマンスを評価しようとしていますが、どのデータでトレーニングされたのでしょうか? 英語用に存在するモデルの名前は、使用されたトレーニングデータに関するヒントを提供しません。

Apache OpenNLP のドキュメントには、POS-Tagger のトレーニングにも使用された可能性があるいくつかのコーパスが記載されています。 http://opennlp.apache.org/documentation/manual/opennlp.html#tools.corpora

英語のPOSモデルがトレーニングされたトレーニングデータを見つける方法を知っている人はいますか?

java apache part-of-speech

2015-05-02T06:39:49.150

0 投票する

1 に答える

282 参照

python-2.7 - 複数の固有名詞を報告するように NLTK の品詞タガーを起動する

パッケージ内の Python の名高い品詞タガーを試してみましょうnltk。

これは私に与えます

[('Buddy', 'NNP'), ('Billy', 'NNP'), ('行った', 'VBD'), ('to', 'TO'), ('the', 'DT') , ('月', 'NN'), ('and', 'CC'), ('来た', 'VBD'), ('戻る', 'NNP'), ('with', 'IN') , ('several', 'JJ'), ('Vikings', 'NNS'), ('.', '.')]

ここでコードを解釈できます。混乱は理解できますが、'Back' が固有名詞 (NNP) として分類されたことに少しがっかりしています。'Vikings' が複数固有名詞 (NNPS) ではなく単純複数名詞 (NNS) と呼ばれるようになったことには、さらに腹を立てています。少なくとも 1 つの NNPS タグにつながる簡単な入力の例を 1 つ思い付くことができる人はいますか?

python-2.7 nlp nltk part-of-speech

2015-07-10T20:34:49.383

0 投票する

2 に答える

377 参照

stanford-nlp - スタンフォード POSTagger と UIMA

UIMA パイプラインで POSTagger(品詞) を作成しようとしています。スタンフォード POSTagger jar をダウンロードしてプロジェクトに添付し、モデルを英語用にコピーしましたが、いくつかの例外がスローされます。

私のコード:

例外：

stanford-nlp uima part-of-speech

2015-07-27T06:51:02.800

1 2 3 4 5 6 7 8 9 10

問題タブ [part-of-speech]

regex - 構文パターンと正規表現パターンを組み合わせて文字列を検索する

nlp - 品詞パターンを見つけるために使用できるツール

java - Apache OpenNLP 品詞タガー: どのデータセットでトレーニングされましたか?

python-2.7 - 複数の固有名詞を報告するように NLTK の品詞タガーを起動する

stanford-nlp - スタンフォード POSTagger と UIMA

Reference