問題タブ [spacy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2104 参照

python - spaCy nlp - 文字列内のエンティティにタグを付ける

文字列があり、人物や場所などのエンティティをマークしたいとしましょう。

人物を [ ] でマークし、場所を { } でマークしたいと思います。

私のコード:

...だから、例の文字列ではこれはうまくいきます。しかし、より複雑な文では、一部のエンティティを二重引用符で囲みます。文の場合:

戻り値>> {Canada}, {Canada}, {Canada}, {Canada}, {{Canada}}, Canada

文の文字列を 2 つに分割した理由は、新しい単語 (より高い文字位置) を置き換えるためだけでした。バグは をループしていることにあると思うdoc.entsので、文字列の古い位置を取得し、新しい [ ] と {} を使用してループごとに文字列が大きくなります。しかし、spaCy でこれを処理する簡単な方法があるに違いないと感じています。