1

Senseval-2 Coarse Sense Dataset を使用したいのですが、同じ説明があります (データセットの形式について)。

2 つの感覚を統合する必要があるかどうかなどの決定データを保持する必要があります。中間値は信頼度ですか? また、彼らは Wordnet 1.7 のプレリリースを使用しました。Wordnet 1.7 を同じものに使用できますか?

ファイルのサンプルは次のようになります。

material%5:00:00:physical:00 3 material%5:00:00:worldly:00

material%3:00:03:: 3 material%5:00:00:worldly:00

material%3:00:04:: 2 material%3:00:01::

マテリアル%3:00:02::

post%5:00:00:成功(a):00

現在%3:00:01::

現在%3:00:02::

現在%3:01:00::

ストーン%3:01:00::

ストーン%5:00:00:クロマティック:00

air%1:15:00:: 4 air%1:27:00::

air%1:19:00:: 4 air%1:27:00::

air%1:27:01:: 4 air%1:27:00::

air%1:04:00::

エア%1:10:02::

air%1:07:00::

エア%1:10:01::

アピール%1:04:00:: 3 アピール%1:10:00::

アピール%1:10:02:: 3 アピール%1:10:00::

4

1 に答える 1

2

調べてみると、真ん中の数字は実際には、同じ統合された感覚にいくつの感覚があるかを表しています。例えば:

matrial%5:00:00:physical:00 3 material%5:00:00:worldly:00
material%3:00:03:: 3 material%5:00:00:worldly:00

は基本的に と同じと考えられる 3 つの感覚があることを言いますmaterial%5:00:00:worldly:00。これらは 2 つの行で提供される 2 つの感覚であり、感覚そのものです。

また、 などの融合しない感覚には数がなく、感覚air%1:04:00material%3:00:04:: 2 material$2:00:01::は 2 つの感覚があることがわかります。したがって、最初の位置の感覚を 2 番目の位置の感覚にマッピングすることで、マージを行うことができます。

于 2013-09-06T04:05:43.550 に答える