私はスタンフォード Coe NLP に基づく NLP プロジェクトに取り組んでいます。各テキスト/センテンスに対応するセンチメントを取得しました。ここのドキュメントのおかげ で、データ フレーム列の各テキストの名詞と関連する形容詞のリストを取得する必要があります。スタンフォードのウェブサイトを試してみましたが、これを達成するためのサンプル関数/コードが見つかりませんでした.これについて助けてもらえますか. ティア
私の text_df データフレームの場合、
with CoreNLPClient(annotators=['sentiment','tokenize','ssplit','pos','lemma','ner', 'depparse'], timeout=60000, memory='16G') as client:
# submit the request to the server
for ind in text_df.index:
ann = client.annotate(text_df["text1"][ind])
dp = sentence.basicDependencies
token_dict = {sentence.token[i].tokenEndIndex-
offset:sentence.token[i].word for i in range(0,
len(sentence.token))}offset += len(sentence.token)
out_parse = [(dp.edge[i].source, dp.edge[i].target,dp.edge[i].dep,)
for i in range(0, len(dp.edge))]
for source, target,dep in out_parse:
print(dep, token_dict[source], token_dict[target])
text_df1['dep'][j]=dep
text_df1['source'][j]=token_dict[source]
text_df1['target'][j]=token_dict[target]
text_df1['Sent_id'][j]=text_sentences
j=j+1
for token in sentence.token:
text_df2['target'][h]=token.word
text_df2['pos'][h]=token.pos
text_df2['Sent_id'][h]=text_sentences
h=h+1
このコードは基本的に、依存関係パーサー (dep)、ソースおよびターゲット トークンを含むデータフレームを 1 つのデータフレーム (text_df1) に作成し、各トークンを POS 値 (text_df2) を別のデータフレームに作成します。名詞と関連する形容詞を含む文の各トークン/単語を取得するという私の要件.最後に、これら2つのテーブルを組み合わせて、必要なデータフレームを取得しました. しかし、私の問題は、「rajはオフィスに行き、彼のオフィスは非常に遠い」という文があります.text_df1について以下のように表示されています。 :poss office 彼の advmod は far advmod far very
理想的には、nsubj(far,office) を使用して依存関係パーサーを表示する必要がありますが、この特定の値がありません。
http://nlp.stanford.edu:8080/parser/index.jspをチェックインすると、同じ文が nsubj(far,office) にも表示されます..
彼らのウェブサイトで「拡張されたユニバーサルな依存関係」を生成するために、Pythonコードを書く必要があると思います。誰でも助けてくれますか