0

Named Entity Recognizer にエンティティ クラスを追加する方法を理解しようとしています。サンプル コードの構造は次のようになります。

ner = EntityRecognizer(nlp.vocab, entity_types=[... ENTITIES ...])
for itn in range(NUMBER_OF_ITERATIONS):
    for raw_text, entities in training_examples:
        ... some data handling ...
        ner.update(doc, gold)

ですが、次の例 (BILUO タグの場合) はner.update()1 回だけ呼び出します (つまり、update()トレーニング データを複数回表示する for ループはありません)。

私はこの質問を読みました。その答えは、トレーニングの例ごとに複数回呼び出す必要があることを教えてくれているようです。update()しかし、私はまた、彼らが例に従っているだけかもしれないとも考えました。

次の文のため(ドキュメントページの最後から)...

次に、コストを使用して損失の勾配を計算し、モデルをトレーニングします。

...私の質問への答えは、「はい、トレーニングデータを「数回」繰り返してトレーニングする必要がある」と推測しています。しかし、そうであれば、「十分」な回数について誰か提案がありますか? (コード例では 5 を使用していますが、それが少なすぎると思う場合は、「回数が多すぎる」ことになるのでしょうか? つまり、「過適合」でしょうか?)

4

0 に答える 0