問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 構文パターンと正規表現パターンを組み合わせて文字列を検索する
R を使用して、POS と実際の文字列を組み合わせて表現されたパターンをテキストから検索したいと考えています。(私はこの機能をPythonライブラリで見ました: http://www.clips.ua.ac.be/pages/pattern-search )。
たとえば、検索パターンは:'NOUNPHRASE be|is|was ADJECTIVE than NOUNPHRASE'
であり、「猫は犬よりも速い」のような構造を含むすべての文字列を返す必要があります。
私は、パッケージが便利な POS タグ付けを好みopenNLP
、提供していることを知っています。qdap
この種のパターン マッチングにその出力を使用している人はいますか?
nlp - 品詞パターンを見つけるために使用できるツール
ドキュメントのコーパスで品詞パターンを見つけるためのツールを探しています。ドキュメントの POS タグ付けにスタンフォード NLP ツールを使用しています。これらのタグ付きドキュメントをクエリして、たとえば次のような特定の POS パターンを見つけたいと思います。
NPはJJ (例: 映画はいいです)
またはJJ NP (例: 素晴らしいフォアグラ)
シンプルで効率的な方法でこれを行うことができるツールはありますか、それとも自分で作成する必要がありますか?
java - Apache OpenNLP 品詞タガー: どのデータセットでトレーニングされましたか?
テキストのコレクションで単語クラスを認識するために、Apache OpenNLP 品詞タガーを使用しています。タガーのパフォーマンスを評価しようとしていますが、どのデータでトレーニングされたのでしょうか? 英語用に存在するモデルの名前は、使用されたトレーニング データに関するヒントを提供しません。
Apache OpenNLP のドキュメントには、POS-Tagger のトレーニングにも使用された可能性があるいくつかのコーパスが記載されています。 http://opennlp.apache.org/documentation/manual/opennlp.html#tools.corpora
英語のPOSモデルがトレーニングされたトレーニングデータを見つける方法を知っている人はいますか?
python-2.7 - 複数の固有名詞を報告するように NLTK の品詞タガーを起動する
パッケージ内の Python の名高い品詞タガーを試してみましょうnltk
。
これは私に与えます
[('Buddy', 'NNP'), ('Billy', 'NNP'), ('行った', 'VBD'), ('to', 'TO'), ('the', 'DT') , ('月', 'NN'), ('and', 'CC'), ('来た', 'VBD'), ('戻る', 'NNP'), ('with', 'IN') , ('several', 'JJ'), ('Vikings', 'NNS'), ('.', '.')]
ここでコードを解釈できます。混乱は理解できますが、'Back' が固有名詞 (NNP) として分類されたことに少しがっかりしています。'Vikings' が複数固有名詞 (NNPS) ではなく単純複数名詞 (NNS) と呼ばれるようになったことには、さらに腹を立てています。少なくとも 1 つの NNPS タグにつながる簡単な入力の例を 1 つ思い付くことができる人はいますか?
stanford-nlp - スタンフォード POSTagger と UIMA
UIMA パイプラインで POSTagger(品詞) を作成しようとしています。スタンフォード POSTagger jar をダウンロードしてプロジェクトに添付し、モデルを英語用にコピーしましたが、いくつかの例外がスローされます。
私のコード:
例外: