問題タブ [wordnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 特定の単語に関連する単語 (特に物理的なオブジェクト) を検索する
1 つの単語に関連する単語 (具体的には物理的なオブジェクト) を見つけようとしています。例えば:
テニス: テニスラケット、テニスボール、テニスシューズ
スヌーカー: スヌーカー キュー、スヌーカー ボール、チョーク
チェス: チェス盤、チェスの駒
本棚: 本
私はWordNet、特にメロニムのセマンティック関係を使用しようとしました。ただし、以下の結果が示すように、この方法には一貫性がありません。
テニス:サーブ、ボレー、フットフォールト、セットポイント、リターン、アドバンテージ
スヌーカー:なし
Chess : チェスの動き、チェッカー盤
本棚: シェルフ
最終的には項の重み付けが必要になりますが、それは今のところあまり問題ではありません。
これを行う方法について何か提案はありますか?
ただの更新:ジェフとストンプチキンの両方の回答を組み合わせて使用することになりました。
ウィキペディアから得られる情報の質は優れており、具体的には (当然のことながら) 関連情報が非常に多くあります (「ブログ」や「iPod」などの用語が存在しない一部のコーパスと比較して)。
ウィキペディアからの結果の範囲は最良の部分です。このソフトウェアは、次のような用語を照合できます (簡潔にするためにリストを省略しています)。
- ゴルフ: [ボール、アイアン、ティー、バッグ、クラブ]
- 写真: [カメラ、フィルム、写真、アート、イメージ]
- 釣り: [魚、ネット、フック、トラップ、餌、ルアー、ロッド]
最大の問題は、特定の単語を物理的なアーティファクトとして分類することです。デフォルトの WordNet は、多くの用語 (「ipod」や「トランポリン」など) が存在しないため、信頼できるリソースではありません。
prolog - Prologでケース変換を行う方法は?
WordNetとやり取りしていて、分類したい用語の一部(さまざまな固有名)がデータベースで大文字になっていますが、取得した入力が正しく大文字になっていない可能性があります。ここでの私の最初のアイデアは、入力の可能なさまざまな大文字化を生成する述語を作成することですが、それをどのように実行するかはわかりません。
誰かがこれをどうやってやるのか、もっと良いのは私がやりたいことを達成するためのより効率的な方法を知っていますか?
sed - ストリームから特定のテキスト行のみを表示してパイプする
Wordnet を使用した辞書検索のコマンド ライン スクリプトを次に示します。
ここに「こんにちは」と入力すると、出力が次のようになります。
S: の後にある文字列のみが必要で、その前には何もありません。以下を削除したいです。
これを単独で配管するために残します->
python - WordNetには「レベル」がありますか?(NLP)
例えば...
鶏は動物です。
ブリトーは食べ物です。
WordNetを使用すると、「is-a」...階層機能を実行できます。
しかし、いつ木の上を移動するのをやめるかをどうやって知ることができますか?レベルが欲しいです。
それは一貫しています。
たとえば、たくさんの単語が表示された場合、wordNetでそれらすべてを分類したいのですが、特定のレベルであるため、それほど高くはなりません。「ブリトー」を「モノ」として分類するのは広すぎますが、「メキシコの包まれた食品」は具体的すぎます。正しいレベルになるまで、階層を上または下に移動したい。
nlp - スペイン語のワードネット
スペイン語でプリンストンの WordNet に似たものはありますか? スペイン語で同義語を見つける必要があります。
keyword - キーワードのコンテンツに基づいて Web サイトをカテゴリに分類する方法
キーワード/メタ/リンクに基づいてサイトを事前定義されたカテゴリのリストに分類する webrobot を作成しています。
私はさまざまなオントロジーのアプローチを検討しており、Wordnet (ハイパーニム/ハイポニム用)、ResearchCyc、WebKb を検討しており、これが私が考えているほど難しい問題なのか、それとも以前に別の場所で解決されたのか疑問に思っていました。
基本的に、並べ替えられたキーワード値の大きなスタックがあり、それらを使用してカテゴリ名と照合したいと考えています。私の現在の考えは、ある種のオントロジー階層でカテゴリ名をチェックすることです。
このようなオントロジーに基づく問題に取り組んだ人は他にいますか?
乾杯!
machine-learning - 意味の階層
単語の階層を構築する方法を探しています。
背景: 私は「アマチュア」の自然言語処理愛好家であり、現在関心を持っている問題の 1 つは、単語のグループから単語のセマンティクスの階層を決定することです。
たとえば、他の「スーパー」表現を含むセットがある場合、つまり
このセット内の他の単語を最も意味があり正確に表現する「動物」という単語を抽出できる手法を使用したいと考えています。
注: 意味は同じではありません。猫 != 犬 != 猿 != 動物 しかし、猫は動物の部分集合であり、犬は動物の部分集合です。
多くの人が私にワードネットを使うように言うでしょう。まあ、やってみますが、実際には、WordNet が適用されない非常にドメイン固有の領域を行うことに興味があります。1) ほとんどの単語は Wordnet にはありません。翻訳は可能ですが、効果は限定的です。
別の例は次のとおりです。
したがって、機能にはこのセットのすべてが含まれます。
また、ウィキペディアのページをクロールして、td-idf などにいくつかの手法を適用しようとしましたが、ウィキペディアのページもあまり効果がありません。
私の研究がどの方向に進むべきかについて、誰かが私を啓発することはできますか? (何でも使えます)
nlp - WORDNET データベース アクセス
wordnet(2.1) をダウンロードしましたが、wordnet データベースへのアクセス方法がわかりません。