問題タブ [part-of-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - WordNet - n と数字は何を表しているのですか?
私の質問はWordNet Interfaceに関連しています。
またはの目的n
と次number
の内容に対する答えが見つかりませんでした。cat.n.01
caterpillar.n.02
python - nltk での数値 POS タグ トレーニング (python)
自然言語電卓を作るために、nltk の TrigramTagger を試してみました。与えられた文で掛け算と2つの数字をタグ付けしたい。例: 「5 と 7 の積は何ですか」。ここで、「product」は「binary.multiply」、「5」は「num-1」、「7」は「num-2」です。この 3 つにタグを付けることができれば、簡単に答えを計算できます。
しかし、以下の出力でわかるように、2 つの数字についてタガーをトレーニングすることができません。番号は、トレーニングされたものとまったく同じでなければなりません。それ以外の場合は、デフォルトで「CD」になります。正規表現などを使用して、num-1 と num-2 についてタガーをトレーニングするにはどうすればよいですか?
このプログラムの出力は num-1 と num-2 の異なる数字を認識しません。どうすれば認識させることができますか?
python - NLTK PoS タギング
Python は初めてで、PoS のタグ付けに必要です。そのため、標準ツールを使用しようとしました。タガーを作成しようとしたところ、理解できない ValueError が発生しました。私のコード:
私はすでに、taged_sents がすべての文のリストであることを確認しました。ドキュメントのように、各文 self はタプル (単語、PoS) のリストです。
:param train: タグ付きセンテンスのリストで構成されるタグ付きコーパス。各センテンスは (単語、タグ) タプルのリストです。
値エラーが発生するのはなぜですか?
ValueError: トレーニング データまたはトレーニング済みモデルのいずれかを指定する必要があります。
lambda - スタンフォード トレーニング ラムダが大きすぎる
Stanford POS Tagger を使用してコーパスをトレーニングしています。設定ファイル「Prop」を用意し、データをフォーマットしてトレーニングを開始しました。
その後、「Lambda Too Big」などのメッセージが表示されるようになり、これらのメッセージはトレーニングが終了するまで発生し続けました。後でモデルを試してみましたが、「メモリ不足の例外」が発生し続けました。40 GB を超える RAM を搭載した HPC でモデルを疲れさせ、25 GB を使用するように Java のヒープ スペースを増やしましたが、同じ問題がまだ発生しています。
私が使用するコーパスには約 6000 の文があり、文の最小単語数は 3 で、最大は 128 単語です。{p1}{p2} のように、1 つの単語に 3 つのタグを同時に付けることができます。
トレーニングを開始すると、ログは次のようになります。
また、小道具ファイルで使用される設定は次のとおりです。
誰が私が間違っているのか教えてもらえますか?