GATE(JavaベースのNLPフレームワーク)を使用していて、辞書と部分的に一致する単語を見つけたいと思っています。たとえば、私は次の用語を含む病気の辞書を持っています
Congestive cardiac failure
Congestive Heart Failure
Colon Cancer
.
.
.
Thousands of more terms
この文字列の文字列として"Father had cardiac failure last year"
、「心不全」が辞書の用語の一部として発生するため、部分一致として識別したいとします。
Python、JS、C#で同様のテーマに関する議論を見たことがありますが、このような場合に何が役立つかはわかりません。ここでアホコラシックを利用できるのかしら。