4

私は自然言語処理のためにさまざまなコーパスを利用してきました。また、WordnetWordSensesで注釈が付けられたコーパスを探していました。

コーパスは手動で作成する必要があるため、この情報を含む大きなコーパスはおそらくないことを理解していますが、何かを取り除く必要があります。

また、コーパスが存在しない場合は、少なくとも意味の注釈が付けられたngramデータベースがあります(単語がその定義のそれぞれである時間の割合、または単語の意味がどれほど一般的であるかに応じて、各ワードネット定義の数値カウント)は)?

4

3 に答える 3

8

WordNet用に注釈が付けられた3つの著名なコーパス:

于 2012-01-11T17:03:08.380 に答える
1

SENSEVAL(現在はSEMEVAL)データの一部はWordNetで注釈が付けられています。

于 2012-01-11T17:07:15.813 に答える
0

senseval2を使用できます。Javaにはsemcor形式と(jSemcor API)、さらにsenseval3があります。これらの2つのコーパスは、語義の曖昧性解消に使用されます。

于 2018-02-05T11:40:54.130 に答える