[ Pete Kirkhamの功績を認めてください。彼は最初に SUMO への言及を行ったので、OP の Alex が尋ねた質問に十分に答えている可能性があります]
(ここでは補足情報を提供しているだけです。コメント欄から始めましたが、すぐにスペースとレイアウト機能が不足してしまいました...)
アレックス: SUMO のほとんどは科学ですか、それとも工学ですか? 食べ物、人、車、仕事などの日常的な言葉が含まれていませんか?
Pete K : SUMO は上位のオントロジーです。ページにリストされている中間レベルのオントロジー (「モノ」と「ビーフ ブリトー」の間の概念を見つける場所) には、食品は含まれていませんが、プロジェクトに資金を提供している組織の種類が反映されています。人のための中間レベルのオントロジーがあります。食品サプライヤーを含む産業(したがって仕事)用のものもありますが、grepした場合、ブリトーについては言及されていません.
私の 2 セント
WordNet (3.0、つまり最新バージョンと古いバージョン) の 100% はSUMO にマッピングされており、それはAlex が必要としているものかもしれません。SUMO (またはむしろ MILO) に関連付けられた中間レベルのオントロジーは、事実上特定のドメインにあり、現時点では Foodstuff は含まれていませんが、WordNet には含まれているため (これらの日常的なもののすべてが含まれています)、あなたはそうしますSUMO の下で正式なオントロジーを利用する必要はありませんが、代わりに Sumo の WordNet マッピングを使用します (WordNet に加えて、これもオントロジーではありませんが、非公式で緩い「階層」が役立つ場合があります)。
ただし、2 つの領域 (およびいくつかの ;-) ?) から、いくつかの問題が発生する可能性があります。
- SUMO オントロジーの「レベル」は、特定のアプリケーションで考えているレベルではない場合があります。たとえば、「Burrito」は「Food」をもたらしますが、SUMO の最上位エンティティでは「 Chicken 」は「Chicken 」をもたらしますが、これは長いチェーンを介してのみ「Animal」を見つけます (具体的には、 Chicken->Poultry->Bird->Warm_Blooded_Vertebrae->椎骨 -> 動物)。
- Wordnet のカバレッジとメタデータは印象的ですが、中間レベルの概念に関しては少し一貫性がない可能性があります。たとえば、「私たちの」ブリトーの上位語は適切に「ディッシュ」であり、「スープ」や「キャセロール」、「チキン マレンゴ」などの一般的な料理を含む約 140 種類の料理を提供します (ただし、「チキン カチャトーレ」は省略します)。
これらの問題を持ち出す際に私が言いたいのは、WordNet や SUMO とそれに関連するオントロジーを批判することではなく、特に中間レベルでのオントロジーの構築に関連するいくつかの課題を単純に説明することです。
SUMO と WordNet に基づいたソリューションの潜在的な欠陥や不足に関係なく、これらのフレームワークを実際に使用することは、「法案に適合する」可能性があります (85% の確率)。