問題タブ [wordnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - NLTKでWordNetをインポートする
辞書をインポートしたいのですwordnet
が、辞書フォームをインポートするとwordnet
、このエラーが表示されます:
このディレクトリにwordnet2.1をインストールしましたが、インポートできませんこの問題の解決にご協力ください
sparql - Wordnetで「字句ファイル」を見つける方法は?
元のWordnet検索を見て、[表示オプション:字句ファイル情報を表示]を選択すると、字句ファイルと呼ばれる非常に便利な単語の分類が表示されます。たとえば、「充填」の場合:
括弧内の最初のものは「字句ファイル」です。残念ながら、この情報を提供するSPARQLエンドポイントを見つけることができませんでした
Wordnet 3.0の最新のRDF翻訳は、次の2つのことを示しています。
TalisSPARQLエンドポイント。たとえば、このクエリを使用して、そのような情報がないことを確認します。
DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-chair-noun-1>
W3Cのマッピングの説明。付録D「変換の詳細」では、役立つ情報について説明しています
wn:classifiedByTopic
。しかし、それは字句ファイルと同じではなく、かなり不完全です。たとえば、「椅子」には何もありませんが、「完成」の感覚の1つは、トピック「アメリカンフットボール」にあります。DESCRIBE <http://purl.org/vocabularies/princeton/wn30/synset-completion-noun-1>
-><j.1:classifiedByTopic rdf:resource="http://purl.org/vocabularies/princeton/wn30/synset-American_football-noun-1"/>
質問:字句ファイル情報を提供するパブリックWordnetクエリAPIまたはデータベースはありますか?
php - wordnetを使用して単語の見出語を取得する
Wordnetを使用して特定の単語の補題を取得するにはどうすればよいですか。ワードネットのドキュメントで欲しいものが見つからなかったようです。 http://wordnet.princeton.edu/wordnet/man/wn.1WN.html
たとえば、「本」という単語の場合、「本」、灰=>灰、予約=>本、リンゴ=>リンゴ...などを取得します。
コマンドラインでwordnetを使用してこれを実現したいのですが、そのような場合を取得するための正確なオプションが見つかりません。
私はもともとwordnetphpAPIを使用するつもりだったので、phpソリューションも非常に役立ちますが、彼らのWebサイトにある現在のソリューションは機能していないようです。
nlp - WordNet.Net を使用した単語感覚の曖昧さ回避
大規模なプロジェクトの一環として単語の意味の曖昧さを解消 する必要があり、WordNet.Net に出会いました。ダウンロードで WordsMatching プロジェクトに付属している wordsensedisambiguator クラスを使用しようとしました。これが私のコードです。
結果を表示すると、すべての単語のセンスはまだ「0」です:(以前にこれを使用したことがある人はいますか、WordSenseDisambiguatorの操作方法を理解できる人はいますか?お急ぎの回答をお待ちしております:)
java - WordNet-単語の同義語と関連する単語の構成-JavaまたはPython
WordNetを使用して、用語の基本セットから同様の用語のコレクションを探すことを検討しています。
たとえば、「落胆した」という単語-潜在的な同義語は次のようになりますdaunted, glum, deterred, pessimistic
。
また、次のような潜在的なバイグラムを特定したいと思いました。beat down, put off, caved in
等
JavaまたはPythonを使用してこの情報を抽出するにはどうすればよいですか?そのようなクエリを可能にするホストされたWordNetデータベース/Webインターフェイスはありますか?
ありがとう!
nlp - ワードネット データベース エディタ
Windows 用の最新の Wordnet バージョン (2.1) をダウンロードしました。2 つの動詞 synset 間のリンクを確立したいと考えています。これに使用できる wordnet synset エディタはありますか? 彼らはファイル構造を説明するドキュメントを公開しましたが、私自身のエディターを書くことに時間を費やしたいとは思いません。
ありがとう
mj
java - bfs で検索する
wordnet から synset を取得し、それを配列として返します。これは私のコードの一部です
この行まで、synset を正常に取得しました。これから行うことは、WordNet synset の検索に幅優先検索を実装することです。すべての類義語を wordnet に格納する RiWordnet ライブラリからメソッド getAllSynsets を呼び出しています。ループ (if..else) を使用してみましたが、検索を停止する場所がわかりません。BFS を使用すると、検索の範囲を知ることが期待されます。検索シノニムは、アクセスされたノードとしてマークされます。これは、同義語の検索で BFS を使用して実装したい概念です。
例えば:
また、BFS の代わりに HashSet を適用することを提案する人もいました。誰でも私を助けることができますか?前もって感謝します..
perl - perlを使用したWordnetシンセット
これらのモジュールに付属する情報コンテンツのスコアと確率を計算する簡単な方法として、 Wordnet ::SimilarityとWordnet::QueryDataをインストールしました。しかし、私はこの基本的な問題に固執しています。単語が与えられたら、それに類似したn個の単語を出力します。これは、シンセットを繰り返し処理して実行することは難しくありませんjoin
。
コマンドを使用し、wn
それをたくさんのパイプでつなぐと、tr
すべてsort | uniq
の単語を取得できます。
出力
しかし、それはちょっと厄介で、さらにクリーンアップする必要があります。
私のスクリプトは以下のようになります。取得したいのは、cat#n1...8のすべての単語です。
脚本
出力:
脚本
出力:
PS私はこれまでperlを書いたことがありませんが、朝からperlスクリプトを調べていて、基本的なことを理解できるようになりました。APIドキュメントを使用してこれを行うためのよりクリーンな方法があるかどうかを知る必要があります-APIまたはユーザーグループのアーカイブから理解できませんでした。
アップデート:
私は次のように解決すると思います:
sed rocks!
python - Pythonを使用してWordnetで関連性を見つける方法
Python を使用して 2 つの単語の関連性 (類似性ではない) を見つけたいと思います。hso (Hirst と St-Onge、1998 年)、lesk (Banerjee と Pedersen、2003 年)、および vector (Patwardhan、2003 年) アルゴリズムはここで Perl で実装されていますが、nltk ライブラリで Python の同じものを見つけることはできません。
Python は大規模なチーム プロジェクトの一部であるため、Python を使用する必要があります。リードはありますか??
python - nltk.corpus.wordnet のどの類似度関数が 2 つの単語の類似度を見つけるのに適していますか?
nltk.corpus.wordnet
2 つの単語の類似性を見つけるのに適切な類似性関数はどれですか?
大きなテキストで同様の検索を行うための関数word clustering
とアルゴリズムを使用したい。yarowsky
collocation