6

例えば...

鶏は動物です。
ブリトーは食べ物です。

WordNetを使用すると、「is-a」...階層機能を実行できます。

しかし、いつ木の上を移動するのをやめるかをどうやって知ることができますか?レベルが欲しいです。
それは一貫しています。

たとえば、たくさんの単語が表示された場合、wordNetでそれらすべてを分類したいのですが、特定のレベルであるため、それほど高くはなりません。「ブリトー」を「モノ」として分類するのは広すぎますが、「メキシコの包まれた食品」は具体的すぎます。正しいレベルになるまで、階層を上または下に移動したい。

4

5 に答える 5

13

WordNetはオントロジーではなくレキシコンであるため、「レベル」は実際には適用されません。

ネットワークの代わりに有向格子が必要な場合にWordNetに関連する上位オントロジーであるSUMOがあります。

一部のドメインでは、SUMOの中間レベルのオントロジーがおそらくあなたが見たい場所ですが、そのトピックのほとんどが科学または工学であるため、「メキシコで包まれた食品」があるかどうかはわかりません。

WordNetの階層は

beef burrito < burrito < dish/2 < victuals < food < substance < entity. 

エンティティはトップレベルの概念であるため、1つ下の物質を停止すると、ブリトーisaフードが得られます。これに基づいてレベルを計算することはできますが、必ずしもSUMOほど一貫性があるとは限らず、終了するための有用な中間レベルの概念の独自のセットを生成することもできません。WordNetには「メキシコのラップフード」のステップはありません。

于 2009-11-08T10:34:12.143 に答える
6

[ Pete Kirkhamの功績を認めてください。彼は最初に SUMO への言及を行ったので、OP の Alex が尋ねた質問に十分に答えている可能性があります]

(ここでは補足情報を提供しているだけです。コメント欄から始めましたが、すぐにスペースとレイアウト機能が不足してしまいました...)

アレックス: SUMO のほとんどは科学ですか、それとも工学ですか? 食べ物、人、車、仕事などの日常的な言葉が含まれていませんか?
Pete K : SUMO は上位のオントロジーです。ページにリストされている中間レベルのオントロジー (「モノ」と「ビーフ ブリトー」の間の概念を見つける場所) には、食品は含まれていませんが、プロジェクトに資金を提供している組織の種類が反映されています。人のための中間レベルのオントロジーがあります。食品サプライヤーを含む産業(したがって仕事)用のものもありますが、grepした場合、ブリトーについては言及されていません.

私の 2 セント
WordNet (3.0、つまり最新バージョンと古いバージョン) の 100% はSUMO にマッピングされており、それはAlex が必要としているものかもしれません。SUMO (またはむしろ MILO) に関連付けられた中間レベルのオントロジーは、事実上特定のドメインにあり、現時点では Foodstuff は含まれていませんが、WordNet には含まれているため (これらの日常的なもののすべてが含まれています)、あなたはそうしますSUMO の下で正式なオントロジーを利用する必要はありませんが、代わりに Sumo の WordNet マッピングを使用します (WordNet に加えて、これもオントロジーではありませんが、非公式で緩い「階層」が役立つ場合があります)。

ただし、2 つの領域 (およびいくつかの ;-) ?) から、いくつかの問題が発生する可能性があります。

  • SUMO オントロジーの「レベル」は、特定のアプリケーションで考えているレベルではない場合があります。たとえば、「Burrito」は「Food」をもたらしますが、SUMO の最上位エンティティでは「 Chicken 」は「Chicken をもたらしますが、これは長いチェーンを介してのみ「Animal」を見つけます (具体的には、 Chicken->Poultry->Bird->Warm_Blooded_Vertebrae->椎骨 -> 動物)。
  • Wordnet のカバレッジとメタデータは印象的ですが、中間レベルの概念に関しては少し一貫性がない可能性があります。たとえば、「私たちの」ブリトーの上位語は適切に「ディッシュ」であり、「スープ」や「キャセロール」、「チキン マレンゴ」などの一般的な料理を含む約 140 種類の料理を提供します (ただし、「チキン カチャトーレ」は省略します)。

これらの問題を持ち出す際に私が言いたいのは、WordNet や SUMO とそれに関連するオントロジーを批判することではなく、特に中間レベルでのオントロジーの構築に関連するいくつかの課題を単純に説明することです。

SUMO と WordNet に基づいたソリューションの潜在的な欠陥や不足に関係なく、これらのフレームワークを実際に使用することは、「法案に適合する」可能性があります (85% の確率)。

于 2009-11-08T23:46:42.160 に答える
2

レベルを取得するには、各レベルのコンテンツを事前に定義する必要があります。オントロジーでは、これらを特定の概念の直接のIS_Aの子として定義することがよくありますが、それがない場合は、その方法を自分で開発する必要があります。

次のステップは、単語ごとに1つのカテゴリのみを表示する場合に備えて、各概念に優先順位を付けることです。優先度は、複数の方法で実行できます。たとえば、カテゴリと単語の間のIS_A関係の数や、カテゴリごとに手動で選択した優先度などです。次に、単語ごとに、最も優先度の高いカテゴリを選択できます。たとえば、肉を化学物質ではなく「食品」にしたい場合があります。

また、パス内にある場合に優先順位を変更する単語を選択することもできます。たとえば、食品でもある化学物質を化学物質として発表したいが、他の化学物質はまだ食品である必要がある場合です。

于 2009-11-08T11:46:47.290 に答える
0

WordNetの上位概念ツリーは、「エンティティ」という単語の単一のルートシンセットで終わります。WordNetのCライブラリを使用している場合は、を使用してシンセットの祖先のしばらく再帰的な構造を取得できます。また、ポインタをヒットするまでポインタtraceptrs_dsを再帰的にたどることで、シンセットツリー全体を取得できます。nextssptrlstnull

于 2009-11-11T20:46:53.680 に答える