2

WordNet における単語間の階層関係はどのように取得されるのだろうか。

それは手動で行われますか、それともコンピューター技術を介して行われますか。

コンピューター技術に基づいている場合、それらは何ですか?

4

1 に答える 1

5

よくある質問から:

q.1.2 WordNet の定義はどこで入手できますか? (簡単な回答) 私たちの辞書編集者がそれらを書きます。

WordNet の定義はどこで入手できますか? (長い回答) 序文から WordNet: An Electronic Lexical Database, pp. xviii-xix:

「あなたの言葉はどこで手に入れたのですか?」と尋ねられることがあります。私たちは 1985 年に、Kučera と Francis の現代編集英語の標準コーパス (ブラウン コーパスとして知られている) の単語から始めました。これは主に、それらがさまざまな品詞の頻度を提供するためです。Henry Kučera が、彼と Francis が Brown Corpus を所有していたにもかかわらず、構文タグ付けデータが Houghton Mifflin に売却されたと警告したとき、私たちはそのリストにうまく入り込みました。したがって、私たちは彼らの頻度カウントを使用する計画を取り下げました (1988 年に、Richard Beckwith は、代わりに使用する多義性インデックスを開発しました)。また、Charles Osgood がセマンティック ディファレンシャルを作成するために使用したすべての形容詞のペアも組み込みました。また、同義語は私たちにとって非常に重要だったので、さまざまなシソーラスで単語を調べました。たとえば、Laurence Urdang の小さな「Basic Book of Synonyms and Antonyms」(1978 年)、Rodale の「The Synonym Finder」(1978 年) の Urdang の改訂版、Robert Chapman の「Roget's International Thesaurus」(1977 年) の第 4 版 -- このような作品では、一言で言えばすぐに他の人につながります。1986 年の終わりに、私たちは海軍人事研究開発センターのフレッド・チャンによって編集された単語のリストを受け取り、それを私たち自身のリストと比較しました。わずか 15% の重複しか見つからなかったことにがっかりしました。1986 年の終わりに、私たちは海軍人事研究開発センターのフレッド・チャンによって編集された単語のリストを受け取り、それを私たち自身のリストと比較しました。わずか 15% の重複しか見つからなかったことにがっかりしました。1986 年の終わりに、私たちは海軍人事研究開発センターのフレッド・チャンによって編集された単語のリストを受け取り、それを私たち自身のリストと比較しました。わずか 15% の重複しか見つからなかったことにがっかりしました。

それで、チャンのリストが入力になりました。そして 1993 年に、ニューヨーク大学の Ralph Grishman と彼の同僚が共通語彙 COMLEX に含めた 39,143 語のリストを取得しました。今回は、WordNet に COMLEX 単語の 74% しか含まれていないことにがっかりしました。しかし、そのリストも入力になりました。要するに、さまざまな情報源が貢献しました。私たちは語彙を構築する際に十分に訓練されていませんでした。実際、英語の語彙は非常に多く、ゆっくりと山を登る間、スポンサーが辛抱強く待ってくれたのは幸運でした.

于 2011-10-16T23:58:03.633 に答える