問題タブ [wordnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
5397 参照

nlp - 特定の単語に関連する単語 (特に物理的なオブジェクト) を検索する

1 つの単語に関連する単語 (具体的には物理的なオブジェクト) を見つけようとしています。例えば:

テニス: テニスラケット、テニスボール、テニスシューズ

スヌーカー: スヌーカー キュー、スヌーカー ボール、チョーク

チェス: チェス盤、チェスの駒

本棚: 本

私はWordNet、特にメロニムのセマンティック関係を使用しようとしました。ただし、以下の結果が示すように、この方法には一貫性がありません。

テニス:サーブ、ボレー、フットフォールト、セットポイント、リターン、アドバンテージ

スヌーカー:なし

Chess : チェスの動き、チェッカー盤

本棚: シェルフ

最終的には項の重み付けが必要になりますが、それは今のところあまり問題ではありません。

これを行う方法について何か提案はありますか?


ただの更新:ジェフとストンプチキンの両方の回答を組み合わせて使用​​することになりました。

ウィキペディアから得られる情報の質は優れており、具体的には (当然のことながら) 関連情報が非常に多くあります (「ブログ」や「iPod」などの用語が存在しない一部のコーパスと比較して)。

ウィキペディアからの結果の範囲は最良の部分です。このソフトウェアは、次のような用語を照合できます (簡潔にするためにリストを省略しています)。

  • ゴルフ: [ボール、アイアン、ティー、バッグ、クラブ]
  • 写真: [カメラ、フィルム、写真、アート、イメージ]
  • 釣り: [魚、ネット、フック、トラップ、餌、ルアー、ロッド]

最大の問題は、特定の単語を物理的なアーティファクトとして分類することです。デフォルトの WordNet は、多くの用語 (「ipod」や「トランポリン」など) が存在しないため、信頼できるリソースではありません。

0 投票する
1 に答える
2214 参照

prolog - Prologでケース変換を行う方法は?

WordNetとやり取りしていて、分類したい用語の一部(さまざまな固有名)がデータベースで大文字になっていますが、取得した入力が正しく大文字になっていない可能性があります。ここでの私の最初のアイデアは、入力の可能なさまざまな大文字化を生成する述語を作成することですが、それをどのように実行するかはわかりません。

誰かがこれをどうやってやるのか、もっと良いのは私がやりたいことを達成するためのより効率的な方法を知っていますか?

0 投票する
3 に答える
410 参照

sed - ストリームから特定のテキスト行のみを表示してパイプする

Wordnet を使用した辞書検索のコマンド ライン スクリプトを次に示します。

ここに「こんにちは」と入力すると、出力が次のようになります。

S: の後にある文字列のみが必要で、その前には何もありません。以下を削除したいです。

これを単独で配管するために残します->

0 投票する
5 に答える
2562 参照

python - WordNetには「レベル」がありますか?(NLP)

例えば...

鶏は動物です。
ブリトーは食べ物です。

WordNetを使用すると、「is-a」...階層機能を実行できます。

しかし、いつ木の上を移動するのをやめるかをどうやって知ることができますか?レベルが欲しいです。
それは一貫しています。

たとえば、たくさんの単語が表示された場合、wordNetでそれらすべてを分類したいのですが、特定のレベルであるため、それほど高くはなりません。「ブリトー」を「モノ」として分類するのは広すぎますが、「メキシコの包まれた食品」は具体的すぎます。正しいレベルになるまで、階層を上または下に移動したい。

0 投票する
4 に答える
7674 参照

java - WordNet で固有名詞を検出しますか?

JAWSを使用してWordNetにアクセスしています。与えられた単語が固有名詞かどうかを検出する方法はありますか? シンセットにはかなり粗い語彙カテゴリがあるようです。

明確にするために、単語にはコンテキストはありません。単語は個別に提示されているだけです。単語が普通名詞として使用できると考えられる場合、それは許容されます。したがって、「マーク」は問題ありません。誰かの名前である可能性がありますが、ポイントを参照することもできるからです。しかし、「アフリカ」はそうではありません。

0 投票する
1 に答える
1995 参照

nlp - スペイン語のワードネット

スペイン語でプリンストンの WordNet に似たものはありますか? スペイン語で同義語を見つける必要があります。

0 投票する
1 に答える
395 参照

keyword - キーワードのコンテンツに基づいて Web サイトをカテゴリに分類する方法

キーワード/メタ/リンクに基づいてサイトを事前定義されたカテゴリのリストに分類する webrobot を作成しています。

私はさまざまなオントロジーのアプローチを検討しており、Wordnet (ハイパーニム/ハイポニム用)、ResearchCyc、WebKb を検討しており、これが私が考えているほど難しい問題なのか、それとも以前に別の場所で解決されたのか疑問に思っていました。

基本的に、並べ替えられたキーワード値の大きなスタックがあり、それらを使用してカテゴリ名と照合したいと考えています。私の現在の考えは、ある種のオントロジー階層でカテゴリ名をチェックすることです。

このようなオントロジーに基づく問題に取り組んだ人は他にいますか?

乾杯!

0 投票する
2 に答える
599 参照

machine-learning - 意味の階層

単語の階層を構築する方法を探しています。

背景: 私は「アマチュア」の自然言語処理愛好家であり、現在関心を持っている問題の 1 つは、単語のグループから単語のセマンティクスの階層を決定することです。

たとえば、他の「スーパー」表現を含むセットがある場合、つまり

このセット内の他の単語を最も意味があり正確に表現する「動物」という単語を抽出できる手法を使用したいと考えています。

注: 意味は同じではありません。猫 != 犬 != 猿 != 動物 しかし、猫は動物の部分集合であり、犬は動物の部分集合です。

多くの人が私にワードネットを使うように言うでしょう。まあ、やってみますが、実際には、WordNet が適用されない非常にドメイン固有の領域を行うことに興味があります。1) ほとんどの単語は Wordnet にはありません。翻訳は可能ですが、効果は限定的です。

別の例は次のとおりです。

したがって、機能にはこのセットのすべてが含まれます。

また、ウィキペディアのページをクロールして、td-idf などにいくつかの手法を適用しようとしましたが、ウィキペディアのページもあまり効果がありません。

私の研究がどの方向に進むべきかについて、誰かが私を啓発することはできますか? (何でも使えます)

0 投票する
5 に答える
2285 参照

nlp - WORDNET データベース アクセス

wordnet(2.1) をダウンロードしましたが、wordnet データベースへのアクセス方法がわかりません。

0 投票する
1 に答える
2902 参照

nlp - どちらが良いですか?OpenCyc または ConceptNet?

私は、他の同様の概念を見つけるために文の概念を認識する必要がある NLP プロジェクトを行っています。これは、既に持っているリストから単語の価数を推測するために行います。WordNet を使い始めましたが、多くの矛盾した結果が得られました。矛盾した結果とは、矛盾した原子価を持つ単語展開を意味します。

だから今、ConceptNet と OpenCyc を調べています。私はすでに ConceptNet を実装しましたが、すべてがとても簡単で気に入っています。問題は、OpenCyc のデータベースがはるかに大きく、論理的に厳格であるように見えることです。これは、WordNet で非常に多くの「矛盾」を見つけたときに重要です...しかし、試したことがないのでわかりません。

OpenCyc を実装する (私にとってはかなりの) 努力をする価値があるかどうか、または単語の価数を推測するのに ConceptNet が十分に優れているかどうか、誰か教えてもらえますか? 彼らはそんなに違いますか?

必要に応じて、さらに詳しく説明させていただきます。今のところ短くしようとしています!

ありがとう!