Pandas には A と B の 2 つの列があり、それぞれに用語の文字列が含まれています。私の目的は、列 A に最も類似している列 B のエントリを見つけることです。これを行うために既に TF-IDF を使用していますが、お金と通貨など、明らかに一致しない同義語が時々あります。
同義語を含む一致を見つけるにはどうすればよいですか?
Pandas には A と B の 2 つの列があり、それぞれに用語の文字列が含まれています。私の目的は、列 A に最も類似している列 B のエントリを見つけることです。これを行うために既に TF-IDF を使用していますが、お金と通貨など、明らかに一致しない同義語が時々あります。
同義語を含む一致を見つけるにはどうすればよいですか?