問題タブ [part-of-speech]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

183 問題

0 投票する

1 に答える

2381 参照

python - WordNet - n と数字は何を表しているのですか?

私の質問はWordNet Interfaceに関連しています。

またはの目的nと次numberの内容に対する答えが見つかりませんでした。cat.n.01caterpillar.n.02

2016-01-16T19:28:22.463

0 投票する

1 に答える

676 参照

python - nltk での数値 POS タグトレーニング (python)

自然言語電卓を作るために、nltk の TrigramTagger を試してみました。与えられた文で掛け算と2つの数字をタグ付けしたい。例: 「5 と 7 の積は何ですか」。ここで、「product」は「binary.multiply」、「5」は「num-1」、「7」は「num-2」です。この 3 つにタグを付けることができれば、簡単に答えを計算できます。

しかし、以下の出力でわかるように、2 つの数字についてタガーをトレーニングすることができません。番号は、トレーニングされたものとまったく同じでなければなりません。それ以外の場合は、デフォルトで「CD」になります。正規表現などを使用して、num-1 と num-2 についてタガーをトレーニングするにはどうすればよいですか?

このプログラムの出力は num-1 と num-2 の異なる数字を認識しません。どうすれば認識させることができますか?

python machine-learning nlp nltk part-of-speech

user2746898

2016-01-18T00:51:17.390

0 投票する

1 に答える

1327 参照

python - POLYGLOT >> ValueError: パッケージ u'pos2.ms' がインデックスに見つかりません

ポリグロットを使用して POS タグにインドネシア語のテキストを付ける方法を学びます。

しかし、エラーが表示されました:

pos2.ms(マレー語の品詞モデル)をダウンロードしようとしたところ、モデルに存在しませんでした。私は何をすべきか？

**Ubuntu と python 2.7 を使用しています

以前はお世話になりました

python part-of-speech pos-tagger polyglot

2016-03-08T17:35:44.163

0 投票する

1 に答える

859 参照

python - NLTK PoS タギング

Python は初めてで、PoS のタグ付けに必要です。そのため、標準ツールを使用しようとしました。タガーを作成しようとしたところ、理解できない ValueError が発生しました。私のコード:

私はすでに、taged_sents がすべての文のリストであることを確認しました。ドキュメントのように、各文 self はタプル (単語、PoS) のリストです。

:param train: タグ付きセンテンスのリストで構成されるタグ付きコーパス。各センテンスは (単語、タグ) タプルのリストです。

値エラーが発生するのはなぜですか?

ValueError: トレーニングデータまたはトレーニング済みモデルのいずれかを指定する必要があります。

python nltk tagging part-of-speech

2016-03-16T09:05:41.557

0 投票する

1 に答える

109 参照

lambda - スタンフォードトレーニングラムダが大きすぎる

Stanford POS Tagger を使用してコーパスをトレーニングしています。設定ファイル「Prop」を用意し、データをフォーマットしてトレーニングを開始しました。

その後、「Lambda Too Big」などのメッセージが表示されるようになり、これらのメッセージはトレーニングが終了するまで発生し続けました。後でモデルを試してみましたが、「メモリ不足の例外」が発生し続けました。40 GB を超える RAM を搭載した HPC でモデルを疲れさせ、25 GB を使用するように Java のヒープスペースを増やしましたが、同じ問題がまだ発生しています。

私が使用するコーパスには約 6000 の文があり、文の最小単語数は 3 で、最大は 128 単語です。{p1}{p2} のように、1 つの単語に 3 つのタグを同時に付けることができます。

トレーニングを開始すると、ログは次のようになります。

また、小道具ファイルで使用される設定は次のとおりです。

誰が私が間違っているのか教えてもらえますか?

lambda stanford-nlp part-of-speech

2016-03-24T06:39:46.577

1 2 3 4 5 6 7 8 9 10

問題タブ [part-of-speech]

python - WordNet - n と数字は何を表しているのですか?

python - nltk での数値 POS タグ トレーニング (python)

python - POLYGLOT >> ValueError: パッケージ u'pos2.ms' がインデックスに見つかりません

python - NLTK PoS タギング

lambda - スタンフォード トレーニング ラムダが大きすぎる

Reference

python - nltk での数値 POS タグトレーニング (python)

lambda - スタンフォードトレーニングラムダが大きすぎる