私は自然言語処理のためにさまざまなコーパスを利用してきました。また、WordnetWordSensesで注釈が付けられたコーパスを探していました。
コーパスは手動で作成する必要があるため、この情報を含む大きなコーパスはおそらくないことを理解していますが、何かを取り除く必要があります。
また、コーパスが存在しない場合は、少なくとも意味の注釈が付けられたngramデータベースがあります(単語がその定義のそれぞれである時間の割合、または単語の意味がどれほど一般的であるかに応じて、各ワードネット定義の数値カウント)は)?