SpaCy v3 でカスタム テキスト カテゴライザーをトレーニングしようとしています。ただし、textcat モデルは繰り返し更新されていないようです。実際、損失はまったく同じです。これが私のコードのトレーニング部分です:
nlp = spacy.load('en_core_web_trf')
config = {
"threshold": 0.5,
}
textcat = nlp.add_pipe("textcat", config=config, last=True)
for label in binarizer.classes_:
textcat.add_label(str(label))
optimizer = nlp.initialize()
for i in range(50):
random.shuffle(TRAIN_DATA)
losses = {}
for batch in minibatch(TRAIN_DATA, size=16):
textcat.update(batch, sgd=optimizer, losses=losses)
print(i, losses)
TRAIN_DATA は例のリストです。
ありがとう