問題タブ [dependency-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - NLP: 動詞に関連付けられている依存タグはどれですか?
動詞に関連付けられているすべての依存関係タグを特定する必要があります。これまでのところ、次のことを特定しました。
'根'
「xcomp」
- 「補助」
他にもありますか?
spacy - 動詞の形に基づくスペーシー パターンの例外ケース
名詞の後に形容詞が続くことを認識するスペーシー パターンを作成しようとしています。これは次のとおりです。
pattern = [{'POS':'NOUN'}, {'POS':'ADJ'}]
ただし、形容詞が動詞の分詞形でない場合を例外として作成しようとしています。私の例はスペイン語なので、申し訳ありません。たとえば、「comprometida」のタグには VerbForm_part=True が含まれているため、「institución educativa」のようなものを見つけて再トークン化したいのですが、「institución comprometida」はそうではありません。
以下を追加してみましたが、'institución educativa' のような場合にのみパターンが完全に機能しなくなりました: pattern = [{'POS':'NOUN'}, {'OP':'!', 'TAG':' VerbForm_part'}, {'POS':'ADJ'}]
私も試しました: pattern = [{'POS':'NOUN'}, {'POS':'ADJ', 'TAG': not 'VerbForm_part'}]
要約すると、名詞とそれに続く形容詞をグループ化する必要がありますが、一部のタイプの形容詞のみをグループ化し、TAG 属性「VerbForm_part」に基づいて他のタイプを除外します。
Spacyでこれを行う方法はありますか? そのパターンで例外をサポートしていますか?
ありがとうございました!
python - 非構造化医療テキストのエンティティ属性抽出
名前付きエンティティとその属性抽出に取り組んでいます。私の目的は、文内の特定のエンティティに関連付けられている属性を抽出することです。
例 - 「患者レポートは ABC 疾患に陽性です」
上記の文で、ABC はエンティティであり、Positive は ABC を定義する属性です。
属性を抽出するための簡潔なアプローチを探しています。エンティティを抽出するソリューションをすでに定式化しています。これは、かなりの精度でシームレスに機能し、現在、問題ステートメントの 2 番目の部分に取り組んで、関連する属性を抽出しています。
降下結果を提供するルールベースのアプローチで属性を抽出しようとしましたが、次の短所があります。
- ソースコードは扱いにくい。
- 新しいシナリオを管理するのはまったく一般的ではなく、困難です。
- 時間がかかる。
より一般的な解決策を示すために、さまざまな NLP 手法を調査し、依存関係ツリーの解析が潜在的な解決策であることを発見しました。
Python/Java を使用した依存関係ツリーの解析を使用してこの問題を解決する方法に関する提案/入力を探しています。
ここで役立つ可能性のある他の手法を自由に提案してください。
python - Stanford Stanza -- 依存関係解析モジュール -- 複数の文を含むドキュメントの出力
解析対象のドキュメントに複数の文が含まれている場合に、依存関係解析モジュールの出力をフォーマットする方法について質問があります。
Stanza マニュアル ( https://stanfordnlp.github.io/stanza/depparse.html ) で依存関係解析モジュールを使用する例の 1 つを次に示します。
この例には、1 つの文のみが含まれています。複数の文を含むドキュメント用にこのコードを修正したいと思います。より具体的には、すべての行に関連する文番号への参照が含まれるようにコードを修正したいと思います。
以下は私自身が思いついたものです:
これは正常に動作しているようです。しかし、私はコードを書いた経験がほとんどないので、私が思いついたことが大丈夫かどうか、または別のことをお勧めするかどうかを教えていただければ幸いです.
どうぞよろしくお願いいたします。