問題タブ [spacy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - spaCy nlp - 文字列内のエンティティにタグを付ける
文字列があり、人物や場所などのエンティティをマークしたいとしましょう。
人物を [ ] でマークし、場所を { } でマークしたいと思います。
私のコード:
...だから、例の文字列ではこれはうまくいきます。しかし、より複雑な文では、一部のエンティティを二重引用符で囲みます。文の場合:
戻り値>> {Canada}, {Canada}, {Canada}, {Canada}, {{Canada}}, Canada
文の文字列を 2 つに分割した理由は、新しい単語 (より高い文字位置) を置き換えるためだけでした。バグは をループしていることにあると思うdoc.ents
ので、文字列の古い位置を取得し、新しい [ ] と {} を使用してループごとに文字列が大きくなります。しかし、spaCy でこれを処理する簡単な方法があるに違いないと感じています。