問題タブ [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 自然言語処理パッケージ
自然言語処理を必要とするプロジェクトに取り組み始めました。スペルチェックと、文をフレーズとその同義語にマッピングしました。私は最初にGATEを使用することを考えましたが、何を使用するかについて混乱していますか?ここで興味深い投稿を見つけたので、さらに混乱しました。
http://lordpimpington.com/codespeaks/drupal-5.1/?q=node/5
自分の目的に最も適したものを決めるのを手伝ってください。私はこのNLPツールをサービスとして使用するWebアプリケーションを使用しています。
java - JavaプログラムからStanford POS Tagger maxentTaggerを呼び出す
Stanford POS tagger は初めてです。
Java プログラムから Tagger を呼び出して、出力をテキスト ファイルに送信する必要があります。Stanford-postagger からソース ファイルを抽出し、maxentTagger を呼び出してみましたが、エラーと警告しか見つかりませんでした。
私のプログラムでmaxentTaggerを呼び出す方法、必要に応じてクラスパスを設定する方法、およびその他のそのような手順について、誰かが最初から教えてくれませんか。私を助けてください。
java - スタンフォードのJavaNLPで親ノードを取得するにはどうすればよいですか?
私がそのような文の塊を持っているとしましょう:
ある時点で、への参照があり、ノードバインディング(JJ single)
を取得したいと思います。正しければ、それはノードの親であり、その兄弟であり、子はありません(?)。ツリーのメソッドを使おうとすると、常にnullになります。APIは、実装が親ノードを決定する方法を知らないためだと言っています。もう1つの興味深い方法はですが、ノードのルートを取得する方法がわかりません。どちらの場合も、パーサーはツリーをインデントしてグループ化する方法を知っているので、「親」ツリーを知っている必要がありますよね?どうすれば入手できますか?ありがとうNP
A single page
NP
A
page
.parent()
.ancestor(int height, Tree root)
java - スタンフォードパーサー-型付き依存関係グラフのトラバース
基本的に、依存関係グラフで2つのNPトークン間のパスを見つけたいと思います。ただし、スタンフォードパーサーでこれを行うための良い方法を見つけることができないようです。何か助けはありますか?
どうもありがとうございます
r - スタンフォードパーサーのRインターフェース
スタンフォードパーサーをRに移植するパッケージはありますか?
java - スタンフォード タガー用の独自のトレーニング コーパスを作成するにはどうすればよいですか?
私は略記や地元の専門用語がたくさんある非公式の英語のテキストを分析しなければなりません。そのため、スタンフォード タガーのモデルを作成することを考えていました。
スタンフォード タガーのトレーニング用に独自のラベル付きコーパスのセットを作成するにはどうすればよいですか?
コーパスの構文と、望ましいパフォーマンスを達成するためにコーパスの長さはどのくらいですか?
nlp - Stanford POS Tagger でコロケーションを識別しますか?
Stanford POS tagger はコロケーションを検出できますか? もしそうなら、どうやってそれを使うのですか?
Stanford POS Tagger 用に独自のトレーニング ファイルを提供したい場合 、WSJ のようなものに従って単語にタグを付ける必要がありますか?
これは、単語をエンティティとコロケーションに「ブラケット」する必要があることを意味します。
もしそうなら、タガーからコロケーションを見つけるにはどうすればよいですか?
パーサーを使用する必要を避けています。
nlp - スタンフォードタガー - タグ付け速度
スタンフォード タガーに関しては、スタンフォード タガーのモデルをトレーニングするために、独自のラベル付きコーパスを提供しました。ただし、タガーのモデルのタグ付け速度は、デフォルトの wsjleft3 タガー モデルよりもはるかに遅いことに気付きました。何がこれに貢献する可能性がありますか? また、モデルの速度を向上させるにはどうすればよいですか? (Penn treebank タグセットに加えて、3 つまたは 4 つのカスタム タグを追加しました)
nlp - スタンフォードタガーのアーチオプション?
left3words
、left5words
、bidirectional
、などの標準の arch オプション以外bi5words
に、残りのオプションは何を意味しますか? そして、それらにはどのような議論が必要ですか?
ドキュメントがどこにも見つからないようです!
java - スタンフォードパーサーオブジェクトのシリアル化
後で使用するために、 Stanford Parserオブジェクト(すべての異なる種類)をファイルにシリアル化する必要がある問題が発生しました。私の知る限り、Stanford Parserオブジェクトのいずれもシリアル化インターフェイスを実装しておらず、疑問に思っています。オブジェクトがシリアル化または同じことを行う別のプロセスを実装していない場合に、Javaオブジェクトをシリアル化する方法はありますか?
ありがとう!