問題タブ [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby - Ruby の StanfordParser ラッパーを適切に使用していますか? 間違った結果を返しています
最新バージョンの stanfordparser とそのための ruby ラッパー ライブラリをインストールしました。ウェブサイトの簡単な例でテストしようとすると:
vi test.rb:
ruby -rubygems test.rb
これは本当に健全性チェックです - 何か間違ったことをしているのですか、それともパーサーまたはラッパーのバグですか?
java - Stanford NER - 複数単語エンティティの抽出
Stanford NER でコロケーションにタグを付けるにはどうすればよいですか? 現在、次のようにタグ付けFederal Reserve Bank of New York
され ています
として認めてもらいたい
これは可能ですか?
stanford-nlp - Stanford POS tagger でのトークン化はどのように行われますか?
Stanford POS tagger を使用して文章にタグを付けます。ドキュメントを文に分割してから、文をトークンに分割したいと考えています。初めてJavaを使用しているので、コマンドラインからタガーを実行したいだけです。
タガーを実行していると、出力が得られますが、「トークン化できません」という警告が表示されます。この警告はどういう意味ですか? トークン化はタガーによって暗黙のうちに行われませんか?
テキストを指定した文に分割するコマンドを実行しようとしましたが、機能しません。タガーは、パスを開けなかったというエラーを出します。
また、すべての出力がごちゃごちゃしないように、テキストファイルの数を入力し、それらの出力を対応するファイルに取得する方法を知りたいです。
java - Stanford NER および Stanford POS tagger の実行中に IncompatibleClassChangeError が発生する
Stanford NER と Stanford POS tagger を 1 つのアプリケーションで使用しようとしています。IncompatibleClassChangeError
POS tagger メソッドを実行しようとすると取得します。
クラス パスに NER と POS タガーの両方の jar ファイルがあります。クラスパスから NER の jar を削除すると、このエラーは発生しません。NER jar と POS jar に共通のクラスがいくつかあると思いますが、java は実行時にどのクラスを使用するかを判断できません。
以下はスタックトレースです:
このエラーが発生する理由がわかりません。
nlp - すべての英単語の頻度ランクを含むリストへのリンク
すべての英語の単語の頻度ランクを含むリストへのリンクを知っている人はいますか. 6 か月ほど前に、このリストを含む 'wiki' で 1 つのリストを見つけましたが、残念ながらブックマークを付けていなかったため、同じリンクまたはより適切なリンクを見つけることができません。誰かがこのリンクまたはそれ以上のものを持っている場合は、投稿してください。
java - スタンフォードの StaggerDemo の corenlp パッケージ
ディレクトリ内のテキストに自動的にタグを付けるプログラムを作成したい。これが私の最初のステップです。TaggerDemo.java に少し変更を加えました。しかし、期待どおりに正しく動作していません。
これは私が得たエラーです。
ファイルが見つからないと表示されるのはなぜですか?
ターミナルでコンパイルしようとすると、edu.stanford.nlp.ling.* をインポートできないと表示されます...
どうもありがとう。
java - スタンフォード パーサーを介してすべての名詞、形容詞のフォーム、およびテキストを抽出する
スタンフォード パーサーを使用して、特定のテキストからすべての名詞と形容詞を抽出しようとしています。
私の現在の試みは、次のようなものを見つけるために Tree-Object の getChildrenAsList() でパターン マッチングを使用しています。
それらを配列に保存します。
入力文:
この論文では、任意のテキストから意味情報を抽出するアルゴリズムを提示します。
結果 - 文字列:
たとえば、名詞などのすべての単語クラスを返すスタンフォード パーサーのメソッドが見つからなかったため、パターン マッチングを使用してみました。
これらの単語クラスを抽出するためのより良い方法はありますか、またはパーサーは特定のメソッドを提供しますか?
java - スタンフォードパーサーの実行時間を短縮するにはどうすればよいですか?
おはよう、
私は自分のアプリケーションにスタンフォードの品詞を使用していますが、多くのテキストファイルを解析する必要があります(20ファイルに達する可能性があります)。しかし、スタンフォードには時間がかかることに気づきました(30分以上かかることもあります)。問題は、スタンフォードが必要のない場合でも、構文ツリーを自動的に構築することです。誰かが以前にこの問題に直面したことがありますか?スタンフォードの解析時間を短縮するにはどうすればよいですか?
よろしくお願いします。
java - スタンフォード パーサーに、パーサーのレキシコンによってライセンスされていない POS タグを受け入れるように強制する
事前にトークン化された文のファイルがあり、そのうちのいくつかは命令文です (暗黙の主語、動詞が最初など)。部分的なタグ付けがない場合、スタンフォード パーサーは、これらの命令文のほとんど (すべてではない) の主語の最初の単語 (動詞) を名詞として誤ってタグ付けします。これらの文の最初の単語に、部分的なタグ付け (これは正しく行っていると確信しています。LexicalizedParser を編集および再コンパイルして、関連するコマンド ライン オプションが認識され、最終的に lexicalizedParser.java 内の適切な場所に配置されるようにしました) を使用します。 (_VB を使用)、タグ付けが存在しない場合と同じように動作します。
lexparser パッケージの概要(「解釈にはいくつかの制限があります...」のページの約 60% を見てください) によると、これは、これらの単語のいくつかに POS タグ VB を配置するのが奇妙すぎるためです。信じるパーサー。
パーサーがすべてのタグを読み取って追跡するようにするにはどうすればよいですか (できればコマンドラインから)。レキシコンを更新しますか?
EnglishPCFG.ser.gz ではなく EnglishFactored.ser.gz を使用すると、この問題は軽減されますが、なくなるわけではありません。
数年前に誰かがスタンフォード [parser-user] メーリング リストに同様の質問を投稿しましたが、この投稿に対する回答が見つからないようです。
編集: パーサーの別のバージョン (2010 年 8 月 20 日以降) を使用すると、この問題は発生しないようです //まったく//。
python - Pythonでパイプを使用する
だから私は、スタンフォード パーサーと lexparser.csh を使用して、このテキスト行を解析したいと考えています。しかし、このコードを実行すると、デフォルトのテキストの出力が得られます。で指定された実際のテキストは解析されていません。それで、私はパイプを正しい方法で使用していますか?そして、多くの例で見てきました - コマンドと一緒に「-」が使用されています。なぜそれが使用されているのですか?私がそれを使用すると、スクリプトは sub.stdout.readline() で停止するだけです