私は問題に行き詰まっており、あなたからの助けを求めています. spacy を使用して複数のエンティティをトレーニングしようとしています
以下は私の列車データです
response =[
('java developer with java and html css javascript ',
{'entities': [(0, 14, 'jobtitle'),
(0 , 4, 'skills'),
(34,37,'skills'),
(38, 49, 'skills')
]
}),
('looking for software engineer with java python',
{
'entities': [
(12, 29, 'jobtitle'),
(40, 46, 'skills'),
(35,39,"skills")
]
})
]
ここに私が問題を抱えている列車コードがあります
nlp = spacy.blank("en")
optimizer = nlp.begin_training()
for i in range(20):
random.shuffle(TRAIN_DATA)
for text, annotations in TRAIN_DATA:
nlp.update([text], [annotations], sgd=optimizer)
エラー: ValueError: [E103] 競合する doc.ents: '(0, 14, 'jobtitle')' および '(0, 4, 'skills')' を設定しようとしています。トークンは 1 つのエンティティの一部にしかできないため、設定するエンティティが重複しないようにしてください。