英語のテキストがあり、そのどこかに単語が欠けているとしましょう。他に情報がない辞書からの候補単語のリストがあります。これらの候補語は、他のかなり不正確なアルゴリズムによって選択されます。WordNet と欠落している単語の周囲のコンテキストを使用して、確率を候補単語に割り当てたいと思います。
これを解決する方法について、私の頭に浮かんだ明白なアドホックな方法があります。1 つの方法は、欠落している単語の周囲にある「興味深い」単語を抽出し、何らかのメトリックに従ってすべての候補単語との意味的類似性を計算し、平均スコアに基づいて候補単語に確率を割り当てることです。
ただし、この問題に関する有用な研究論文は見つかりませんでした。
それで、私が尋ねているのは、この問題に関する研究 (論文) を知っているかどうかです。私の提案をどのように見つけますか?