問題タブ [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
lisp - 解析ツリーを操作するにはどうすればよいですか?
私は自然言語解析ツリーをいじり、さまざまな方法でそれらを操作してきました。私はスタンフォード大学の Tregex ツールと Tsurgeon ツールを使用してきましたが、コードがごちゃごちゃしていて、ほとんどが Python である私の環境にはうまく適合しません (これらのツールは Java であり、微調整には適していません)。より多くの機能が必要なときに簡単にハッキングできるツールセットが欲しいです。ツリーでパターン マッチングを実行し、一致したブランチを操作するのに適したツールは他にありますか?
たとえば、次のツリーを入力として使用したいと思います。
および (これは単純化された例です):
- ラベル NP を持つ最初の子、"Bank" という名前のいくつかの子孫、およびラベル PP を持つ 2 番目の子を持つ、ラベル NP を持つ任意のノードを見つけます。
- それが一致する場合、PP ノードのすべての子を取得し、それらを一致した NP の子の最後に移動します。
たとえば、ツリーの次の部分を見てください。
そしてそれをこれに変えます:
私の入力ツリーは S 式であるため、Lisp を使用することを検討しました (私の Python プログラムに組み込まれています)。
パターンを説明する良い方法は何でしょうか? 操作を説明する良い方法は何でしょうか? この問題について考える良い方法は何ですか?
nlp - スタンフォードパーサーを使用してPOSタグを取得する方法
スタンフォードパーサーを使用して単語のペア間の依存関係を解析していますが、単語のタグ付けも必要です。ただし、ParseDemo.javaでは、プログラムはタグ付けツリーのみを出力します。次のような各単語のタグ付けが必要です。
このようではありません:
誰が私を助けられるか?どうもありがとう。
java - Stanford NLP APIを使用してNLクエリからフレーズまたはトークンを取得するにはどうすればよいですか?
プログラムで使用するために、スタンフォードパーサーから返されたフレーズが必要です。
java - スタンフォードパーサー-型付き依存関係
スタンフォードパーサーで所有格の依存関係を処理する必要があります。出力形式を使用するメーリングリストを読みました。
しかし、私はこの例外を受け取ります。この出力形式をサポートするスタンフォードパーサーへのリンクを教えてもらえますか?
現在、Stanfordパーサーバージョン9-07-2010を使用しています。
java - スタンフォード パーサーの型付き依存関係
スタンフォード パーサー オンラインで指定された型指定された依存関係と、指定されたソースコードによって生成された依存関係は同じではありません。
スタンフォードの Web サイトで入手できるソース コードのバージョンは、略語、所有格、および所有格のタグを生成しません。
これらのタグの生成に使用するスタンフォード パーサーのバージョンは?
java - Stanford Parser での不正な引数の例外
スタンフォード パーサーを使用して文を解析しようとしましたが、例外が発生します。入力ファイル、コード、および例外を以下に指定します。
問題は、入力ファイルのペンツリーが句読点を処理しないためだと思います。句読点も処理するペンツリーを生成するにはどうすればよいですか?
入力ファイル
コード
発生した例外:
parsing - opennlp vs stanford nlptools vs berkeley
こんにちは目的は、ウィキペディアのようなかなりのコーパスを解析して、最も可能性の高い解析ツリーと固有表現抽出を生成することです。パフォーマンスと精度の観点から、これを実現するのに最適なライブラリはどれですか?上記のライブラリを複数使用したことがありますか?
java - スタンフォードパーサーで名詞と動詞を見つける
単語が動詞か名詞か、またはその両方かを調べる必要があります
たとえば、単語は「検索」であり、名詞と動詞の両方である可能性がありますが、スタンフォード パーサーはそれに NN タグを付けます..
スタンフォードパーサーが「検索」が名詞と動詞の両方であることを示す方法はありますか?
私が今使っているコード
または、他のソフトウェアを使用してそれを行う必要がありますか?私に提案してください 事前に感謝します
java - スタンフォード NER ツールキット - 小文字エンティティの認識
私は NLP の初心者であり、Named Entity Recognizer が名前付きエンティティに注釈を付ける方法を理解しようとしています。私は Stanford NER ツールキットを試しています。ニュースワイヤーやニュース ブログなど、すべての命名規則に従って名前付きエンティティを表す、より正式な標準的なデータセットで NER を使用すると、NER はエンティティに正しく注釈を付けます。ただし、Twitter などの非公式のデータセットで NER を実行すると、名前付きエンティティが本来のように大文字にされない可能性があり、NER はエンティティに注釈を付けません。私が使用している分類子は、3-CRF のシリアル化された分類子です。NERに小文字のエンティティも認識させる方法を誰か教えてもらえますか?? NER をハックする方法と、この改善をどこで行うべきかについての有益な提案は大歓迎です。ご協力いただきありがとうございます。
java - 多くのニュース記事をクロールするには何を使用すればよいですか?
私は自然言語処理のプロジェクトを持っていますが、そのためには、Yahoo ニュース、Google ニュース、ブログなどのソースから多くの Web 記事をクロールする必要があります...
私は Java 開発者です (つまり、Java ツールを使用したいのです)。私は自分で各ソース Web サイトを解析し、HttpClient / XPath で記事を抽出できると思いますが、私は少し怠け者です :) ソースごとにパーサーを作成する必要がないようにする方法はありますか?
(新しい記事だけでなく、2000年から現在までの記事にも興味があります)