問題タブ [corenlp-server]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
stanford-nlp - スタンフォード CoreNLP サーバーがログを無効にする
サーバーのログはかなり網羅的だと感じています。ログ出力を無効にするか減らす方法はありますか? ドキュメントをサーバーに送信するstdout
と、パフォーマンスを低下させる可能性のあるコンテンツが書き込まれるようです。
どうにかしてそれを行うことはできますか?
アップデート
サーバーからの出力を抑制する方法を見つけました。それでも私の質問は、実際のサーバーのコマンドライン引数を使用してこれを行う方法と場合です。ただし、汚い回避策の場合、次の方法でオーバーヘッドを軽減できるようです。
でサーバーを実行する
どこで>/dev/null
出力を何もパイプしません。残念ながら、これだけでは役に立ちませんでした。2&>1
ここでトリックを行うようです。私はそれが実際に何をしているのかわからないことを告白します。ただし、2 つの実行を比較しました。
2&>1 >/dev/null で実行
追加の引数なしで実行
これは非常に浅いテストでしたが、かなりの影響があるようです。ここでの差は 1.828 倍であり、時間の経過とともにかなりの差になります。
ただし、これは簡単なテストであり、結果が完全に正常であるとは保証できません。
さらに更新:
これは、JVM が時間の経過とともにコードを最適化する方法に関係していると思いますが、1 センテンスあたりの時間は、ローカル マシンでの時間と比較できるようになります。ロギング2&>1 >/dev/null
を排除するために以下の結果が得られたことを覚えておいてください。stdout
java - 自分のスタンフォード CoreNLP サーバーをセットアップする際の問題:
http://stanfordnlp.github.io/CoreNLP/corenlp-server.htmlのチュートリアルに従って、独自のスタンフォード パーサー サーバーをセットアップしています。ただし、サンプル コードを貼り付けると、エラーが発生します。
これが私のコードです:
java - Stanford CoreNLP: -nthreads フラグにより、すべての ner 値が O になります
-nthreads {int}
引数をスタンフォード CoreNLP (バージョンstanford-corenlp-full-2015-12-09
) に追加すると、すべてのトークンの出力 NER 値が O (= 名前付きエンティティではない)になる理由を理解しようとしています。
簡単な例として、 というファイルを作成し、sample-file.txt
その内容をSamuel Huntington
. 次に実行します。
これにより、期待される出力が生成され、「Samuel」が人として認識されます。
ただし、上記のコマンドに追加-nthreads 8
すると、出力は Samuel が人であることを示しません。完全なコマンド:
生成するもの:
価値があるのは、-nthread {int}
(つまり、s のないスレッド) が問題を解決するので、このコマンドを使用するだけです。ただし、他の人が -nthreads フラグを使用しようとする場合に備えて、この質問はここに残します。
PS これが私の CLASSPATH (から取得echo $CLASSPATH
) で、先週ダウンロードしたスタンフォード CoreNLP ディストリビューションのみが含まれています。/Users/dduhaime/Desktop/everett/wiki_facts/stanford-corenlp-full-2015-12-09/*:
r - R: getSentiment の NA を返すスタンフォード CoreNLP
次のテキストデータがあります。
私はいつも古い学校の男を好みます。私は科学の博士号を取得しています。同じバックグラウンドを持つ人を見つけることにはあまり興味がありません。そうでなければ、人生は退屈なものになるでしょう。
そして、上記のテキストの感情スコアを抽出しようとしていますが、得られるのはすべて NA です。
なぜ発生しているのかわかりませんが、グーグルで調べましたが、関連する回答は見つかりませんでした。とりあえず、coreNLPパッケージ内で提供されているサンプルデータを試してみると
それは私に答えを与えるので、なぜこれが起こっているのかわかりません。誰かが洞察を提供できれば幸いです。
stanford-nlp - PythonでCoreNLPサーバーの返された文字列から解析ツリーを取得するには?
私はcorenlpサーバーでpycorenlpを使用しています。文字列形式で解析木を取得できます。しかし、NLTK ライブラリのようにツリーとして取得できますか?
出力: