1

Entity Linking (EL) に spaCy を使用したい。ドメイン固有のコーパスでカスタム ラベルを使用して、spaCy Named Entity Recognition (NER) モデルをトレーニング済みです。ただし、次の例では、通常のエンティティ ラベル PERSON と LOCATION を使用します。

ナレッジ ベース (KB) にエイリアスを設定すると、KB は認識されたエンティティの出現候補を返します。たとえば、「パリ」の候補は、ウィキデータ エントリ Q47899 (パリス ヒルトン)、Q7137357 (パリス テメン)、Q5214166 (ダン パリス)、Q90 になります。 (パリ、フランスの首都)、または Q830149 (パリ、米国テキサス州ラマー郡の郡庁所在地)。

私の質問は、認識されたエンティティ ラベルに関するものです。NER が「パリ」を PERSON として認識すると、Q90 (フランスの首都パリ) と Q830149 (パリ、米国テキサス州ラマー郡の郡庁所在地) が候補から除外され、3 つの候補が残ります。一方、「パリ」が LOCATION として認識された場合、残りの候補は 2 つだけです。

検出された NER ラベルを考慮して、どのエンティティ セットから候補を選択するかを KB または EL モデルにアドバイスすることは可能ですか? ELモデルのトレーニングの前後?

4

2 に答える 2

0

私はちょうど自分でアイデアを持っていました。2 つのパイプを使用して、エンティティ タイプごとに個別の NER モデルをトレーニングすることは可能だと思います。次に、各パイプに個別の KB と EL モデルを用意します。次に、パイプの結果を結合します。

于 2020-10-13T10:13:35.833 に答える