同義語を一意のコードまたは単語にマップする Java ベースのアプリケーションを開発したいと考えています。たとえば、医学用語では、 heart attack
または cardiac arrest
などという言葉は同じことを意味します。そのため、そのようなマッピングを格納するデータベース (RDBMS である必要はありません) を構築したいと考えています。このようなマッピングは、後で追加/変更または削除する必要があります。
主な目的は、エンティティを意味的に一緒にマップするアプリケーションを開発することです。
入力は 2 ~ 3 単語のフレーズのようになり、標準コードにマッピングされます。疾患コードHA50122445にマッピングされた心臓発作と心停止の例。明日、新しいフレーズ say myo heart illegal を見つけたら、コードHA50122445にマッピングしたいと思います。
Apache Luceneを見てみましたが、テキストマイニング用、検索キーワードに基づく優先度用です。私の要件はWordnetに似ています。Wordnet データベースは編集可能または変更可能ですか? 私の調査によると、いいえ。そうですか?
ご指導いただけると大変助かります。ありがとうございました