問題タブ [stanford-nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
stanford-nlp - スタンフォード NLP Web ツール?
Stanford CoreNLP ソフトウェアの最新バージョンをダウンロードしました。WebCrawler.java などの Web ツールはどこにありますか? 提供されたダウンロードでそれらを見つけることができません。ティア
text-parsing - Stanford-Parser を使用してテキストからアラビア語の固有名詞を抽出する
Stanford Parser を使用して、テキストからアラビア語の固有名詞を抽出しようとしています。
たとえば、入力文がある場合:
アラビア語のスタンフォード パーサーを使用すると、ツリー ダイアグラムは次のようになります。
適切な名前を抽出したい:
サブツリーを持つもの:
私はこれを試しました:同様の質問
しかし、この行には何か問題があります:
taggedYield()
タグ付けされた単語のリストにツリータイプを入れる際のエラー 提案された関数をどこで使用できるかがわかりませんでした
何かアイデアはありますか?
java - スタンフォードコアNLP-共参照解決を理解する
スタンフォードNLPツールの最後のバージョンでcorefリゾルバーに加えられた変更を理解するのに問題があります。例として、以下は文と対応するCorefChainAnnotationです。
これらの数字の意味がよくわかりません。ソースを見ても実際には役に立ちません。
ありがとうございました
nlp - 使いやすさ: スタンフォード CoreNLP と OpenNLP の比較
個人的なプロジェクトで一連の NLP ツールを使用しようとしていますが、スタンフォードの CoreNLP と OpenNLP のどちらが使いやすいか疑問に思っていました。または、お勧めの別の無料パッケージはありますか? これまで NLP を実際に行ったことがないので、概念を学び、自分のアイデアのプロトタイプを作成するためにすぐに使用できるものを探しています。どんな助けでも大歓迎です。
java - Stanford Tregex を使用したサブツリーの抽出
Tregex を使用してサブツリーを抽出するクラスを作成しました。プログラムにコンソール コマンドを使用させたくないので、「TregexPattern.java」からいくつかのコード スニップを使用しました。
一般に、文のツリーを持っているので、特定のサブツリーを抽出したい (ユーザーの操作なし)。
私がこれまでに行ったことは次のとおりです。
しかし、次のエラーが発生します。
変更やアイデアはありますか?
ruby - treetop と stanford nlp を使用したデータと POS の解析
イベント (コンサート、映画など) のデータを Ruby で解析しようとしていますが、どのツールを使用すればよいかわかりません。
最初はスタンフォード パーサーが適していると思っていましたが、ツリートップについて聞いたことがあります。
スタンフォードパーサーをRuby on Windowsで動作させるには、2日以上の検索と苦労が必要であり、インストールするだけでエラーが後を絶たないため、私は両方に苦労しています。
Treetop は問題なくインストールされましたが、ドキュメントは非常に限られており、収集できる限り、treetop は実際のコンテンツよりも文法構造を扱うのに最適であるように見えますが、Treetop の機能を完全に理解していないだけかもしれません。
良いことの 1 つは (私が思うに)、バンド名と映画名の大規模なデータベース/コーパス (?) と、取得しようとしているデータのかなり限定された部分があることです。
たとえば、1 つのリストは
別のリストは
各リストで、誰/何、日付、時間、都市、会場など、かなり具体的な詳細のグループを取得しようとしています.
私はすでにバンド名のデータセットを持っており、都市名のリストを取得するのはかなり簡単なはずなので、他の詳細を選択するのは「かなり」簡単なはずですが、どのツールを専用にするべきかわかりませんまたは、これを行うためのより良い方法がある場合は?
助言がありますか?
dependencies - Stanford Parser APIを使用して数値的に発生する単語を見つける方法は?
型付けされた依存関係では、スタンフォード パーサーは単語の出現場所、たとえば「love-2」も示します。これで、「愛」が「2」位に表示されます。
では、スタンフォード パーサー API を使用してプログラムで単語の場所を見つけるにはどうすればよいでしょうか。APIにファナクションはありますか?
python - jpypeを使用したスタンフォードパーサー
jpype を使用してスタンフォード パーサーを使用しようとすると、次のエラーが表示されます。
initのファイル「C:\Python26\lib\site-packages\stanford_parser\parser.py」の 103 行目
ファイル "C:\Python26\lib\site-packages\jpype_jpackage.py"、55 行目、呼び出し中
TypeError: パッケージ edu.stanford.nlp.parser.lexparser.LexicalizedParser は呼び出し可能ではありません
nlp - Stanford Topic Modeling Toolbox でのラベル付き LDA 推論
LabeledLDA を行うために Stanford Topic Modeling Toolbox v.0.3 を使用しています。提供されたドキュメント( example-6-llda-learn.scala )を使用して、LabeledLDA モデルをトレーニングすることができました。新しいデータセットのラベルを予測するにはどうすればよいですか?
新しいデータセットの推論にexample-3-lda-infer.scalaに似たコードを使用しようとしましたが、成功しませんでした。誰でもこの問題で私を助けてもらえますか?
編集 これは私が推論に使用するコードですが、機能していません:
このコードを実行するとjava -Xmx3g -jar tmt-0.3.3.jar infer_llda.scala
、次のエラーが発生します。
@Skarab の助けを借りて、ラベル付き LDA の学習と推論のソリューションを以下に示します。