問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - ミニパーの起動
Minipar パーサー、POS モジュール、特に代名詞解決パーサー (coreferrence resolution) を使用したいと考えています。私は Windows 10 を使用しており、Minipar を含む GATE バージョン: GATE_Developer_8.1 をダウンロードしました。ユーザーマニュアルに従いましたが、GATE インターフェイスでパーサーを実行できませんでした。誰か助けてくれませんか?ありがとうございました。
parsing - SyntaxNet の大文字と小文字を区別しない POS (品詞) タガー
Parsey McParseface
Syntax Net に付属しているトレーニング済みの POS tagger を試してみましたが、適切な大文字の文のタグ付けに適しています。
のように、すべて小文字i grew up in toronto
の文にタグを付けてから、それを解析して都市などの名前付きエンティティ(この場合は ) を識別したいと思いtoronto
ます。
いくつか質問があります。
- 使用できる SyntaxNet 用の事前トレーニング済みの大文字と小文字を区別しない POS タガーはありますか?
- 大文字と小文字を区別しない独自のPOS タガーを SyntaxNet 用にトレーニングするにはどうすればよいですか?
- SyntaxNet POS タガーのトレーニングには、かなりの量の CPU/GPU パワーが必要ですか、それとも、Amazon または同様のサービスでレンタルできる通常のサーバーで実行できますか?
- Google がトレーニングに使用したデータセットは
Parsey McParseface
公開されていますか?
c# - c#で特定の文字列配列の品詞タグ付けを実装する方法は?
C# のみで実装する簡単な英語の POS タグ付けプログラムが必要です。
neural-network - Keras を使用して品詞タガーを作成する方法は?
Keras の助けを借りて、ニューラル ネットワークを使用して品詞タガーを実装しようとしています。
私はシーケンシャル モデルを使用しており、NLTK のペン ツリーバンク コーパス (つまり、nltk.corpus インポート ツリーバンク) からデータをトレーニングしています。私の理解によると、Keras でニューラル ネットワーキングを形成するには、次の手順が含まれます。
- データを読み込む
- 定義 -> コンパイル -> モデルの適合
- モデルを評価する
具体的には、タグ付けされたトレーニング データをモデルで使用するために前処理する方法がわかりません。これらのタグ付けされたデータは nltk のコーパスから取得されます。これらはキーと値のペアであり、キーは英単語、値は対応する POS タグです。
正確には、次のコードの「data」変数と「labels」変数でデータを配置する方法がわかりません。
model.fit(data, labels, nb_epoch=50, batch_size=32)
誰かヒントを教えてください。お時間を割いていただき、本当にありがとうございました。
python - Spacy NLP - 正規表現によるチャンキング
Spacy には、noun_chunks
名詞句のセットを取得する機能が含まれています。関数english_noun_chunks
(以下に添付)は使用しますword.pos == NOUN
正規表現を維持する文からチャンクを取得したいと思います。たとえば、0 個以上の形容詞の後に 1 個以上の名詞が続く I 句。
english_noun_chunks
関数をオーバーライドせずに可能ですか?
java - StanfordNLP POS の混合結果
私は Stanford NLP POS Tagger をテストしていましたが、さまざまな結果が得られています。
次の出力が得られます
このような問題にどう対処すればよいでしょうか?実際には同じ言葉を並べ替えたものです。
編集
たぶん、私は問題を説明する必要があります。
2つの文を比較したい。私のアプローチは、両方の文字列で POS を実行し、両方の文字列から名詞/形容詞/動詞を個別に比較してスコアを付けることです。
しかし、単語の順序に基づくあいまいなタグ付け (@Elliott も参照) のために、私のランキングが失敗する場合があります。誰かが回避策を提案できますか?
重みを提供するためにスコアリング アルゴリズムで使用できる名詞が形容詞や動詞などに分類される確率を示す分類統計はありますか?
ありがとうチャハット
part-of-speech - Google NL API は、注釈構文の応答でどのタグを使用しますか?
Google NL API の注釈構文メソッドを使用し、Brat を使用して応答を視覚化しています。Google NL API で使用される単語と依存関係の「タグ」または「ラベル」の正確なリストはどこにありますか。
"partOfSpeech": { "タグ": "ADJ",
"dependencyEdge": { "headTokenIndex": 9、"label": "AMOD"