ファイルに医学用語のリストがあります。トークン化され、単語に見出し語化されたツイートのリストがあります。
ツイート内の単語と医療ファイル内のすべての単語の類似性を確認したい。ツイート内の単語が医学用語にどれだけ近いかを確認したい。
上記は実現できますか?上記を達成するためのすべての可能な方法で私を助けてください。
ありがとう
用語は医療分野のものであるため、UMLS の使用を検討することをお勧めします。UMLS::Similarity は、医学用語間の類似性を見つけるのに役立ちます。 http://umls-similarity.sourceforge.net
がんばれ、テッド