Wordnet で、膨大な数の単語の同義語を検索しています。私が行った方法では、いくつかの単語に複数の同義語がある場合、結果はアルファベット順に返されます。私が必要とするのは、それらを発生確率で並べ替えることです。上位 1 つの類義語だけを使用します。
Prolog ワードネット データベースと Syns2Index を使用して、同義語をクエリするための Lucene タイプ インデックスに変換しました。このように確率で並べ替える方法はありますか、それとも別のアプローチを使用する必要がありますか?
速度は重要ではありません。この同義語の検索はオンラインでは行われません。