Entity Linking (EL) に spaCy を使用したい。ドメイン固有のコーパスでカスタム ラベルを使用して、spaCy Named Entity Recognition (NER) モデルをトレーニング済みです。ただし、次の例では、通常のエンティティ ラベル PERSON と LOCATION を使用します。
ナレッジ ベース (KB) にエイリアスを設定すると、KB は認識されたエンティティの出現候補を返します。たとえば、「パリ」の候補は、ウィキデータ エントリ Q47899 (パリス ヒルトン)、Q7137357 (パリス テメン)、Q5214166 (ダン パリス)、Q90 になります。 (パリ、フランスの首都)、または Q830149 (パリ、米国テキサス州ラマー郡の郡庁所在地)。
私の質問は、認識されたエンティティ ラベルに関するものです。NER が「パリ」を PERSON として認識すると、Q90 (フランスの首都パリ) と Q830149 (パリ、米国テキサス州ラマー郡の郡庁所在地) が候補から除外され、3 つの候補が残ります。一方、「パリ」が LOCATION として認識された場合、残りの候補は 2 つだけです。
検出された NER ラベルを考慮して、どのエンティティ セットから候補を選択するかを KB または EL モデルにアドバイスすることは可能ですか? ELモデルのトレーニングの前後?