タイトルとその他の情報を含む 2 つのデータセットがありますが、データセット AI にはタイトルがあり、データセット BI にはタイトルと URL があります。
データセット B からデータセット A に URL を配置する必要があります。A と B で同じタイトルもあれば、そうでないものもあれば、わずかに異なるものもあります (ここに問題があります)。
したがって、似ているものを同時にマージしてクラスター化する必要があります。DBpedia と調整できることはわかっていますが、必要なのは 2 つのデータセットを "調整" することです。何らかの方法で可能ですか?
ありがとうございました。