問題タブ [wordnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - Javascript を介して Prolog をクエリする方法は?
WordNet データベースのクエリに SWI-Prolog を使用しています。ここで、ユーザーから単語を受け取り、それをデータベースに対して照会する HTML インターフェースを構築する必要があります。
Prolog に単語をクエリにラップして送信する JS コードを作成するにはどうすればよいですか? また、Web ページに表示できる意味のある変数で結果を取得するにはどうすればよいですか?
windows - rでのwordnetの並行使用(Windows 7を使用)
Windows 7 コンピューターで R の wordnet パッケージを使用して並列処理を利用しようとしています。具体的には、名詞のリストの同義語を見つけようとしています。私がやろうとしていることを示すために以下のサンプルコードをいくつか作成しましたが、並列で正しく実行されていないようです。ワーカーを起動し、ワーカーの 1 つを計算していますが、他のワーカーは計算していません。以下に作成したリストは、長さが 4 で、各スロットに 4 つの単語があります。リストを使用可能なコアの数で分割し、リストのサブセットを各コアに送信しようとしています。次に、sapply 関数は (並列ループ内で) 4 つの単語の同義語を取得します。Snowfall でもこれを試してみましたが、辞書をエクスポートすることはできませんでした (sfExport では実行されなかったようです)。「.export」を使用していません ディクショナリが見つからないというエラーも発生していたため、 foreach ループ内で実行しましたが、並列ループ内に配置すると機能するようです。どんな助けでも大歓迎です。
python - パスベースの類似性またはワードネットでの類似性が何らかの意味でナンを与えるのはなぜですか?
たとえば、2 つの感覚Synset('mile.n.03')
を取り、Synset('support.v.09)
次のようにこれらの 2 つの感覚の間のパス ベースの類似性を計算する と、
なぜこれが起こっているのですか?それとも、私が犯している根本的な間違いがありますか?
python - Python NLPで(NLTKからの)一連のシンセット全体を検索する
元の質問:
単語の多義性は、それが持つ感覚の数です。WordNetを使用すると、名詞dogがlen(wn.synsets('dog'、'n'))で7つの感覚を持っていることを判別できます。WordNetに従って、名詞、動詞、形容詞、副詞の平均多義性を計算します。
質問から集めたものから、私はWordNetでNLTKに組み込まれた多義性メソッドを使用して、何かが持っている感覚の数を見つけることでした。
さらに重要なことに、私は利用可能なすべてのシンセットを使用してそれらをループし、返されたすべての値をセットに入れようとしています。この後、合計を受け取るために新しく作成されたセット(整数で埋められた)内のすべてのシンセットの総数を追加するつもりでした。この合計を取得した後、平均を受け取るためにエントリの総数を分割します。
私の最大の質問は...名詞、動詞、形容詞、副詞だけでなく、利用可能なすべてのシンセットをループする方法を教えてください。
- さまざまなWebサイトを調べたところ、「wn.all_synsets('n')」の場合、可能な名詞のsynsetがすべて返されることがわかりました。
ただし、返されるタイプは「ジェネレーター」です。ループを使用して「ジェネレーター」タイプを反復処理するにはどうすればよいですか?
。>>>allsynsets= wn.all_synsets('n')
。>>>allsynsets
<.generator object all_synsets at 0x04359F30>
。>>>type(allsynsets)
<.type'ジェネレータ'>
誰もがこの問題の答えを見つけることができるように、十分な情報を提供したことを願っています。この問題のジェネレータタイプを理解するためのインポートとテストを除いて、ソースコードはありません。
お時間をいただきありがとうございます。
machine-learning - Sentiwordnet3.0の使用
センチメント分類にSentiwordnet3.0を使用する予定です。Sentiwordnetの単語に関連付けられている数字が何を表しているのかを誰かが明確にできますか?たとえば、ランク#5の5はどういう意味ですか?また、POSの場合、副詞を表すために使用される文字は何ですか?「a」は形容詞だと思います。彼らのサイトでも他のサイトでも説明が見つかりませんでした。
nlp - Wordnet編集ツリー構造
Wordnet の概念階層を操作に使用するアプリケーションを開発しています。必要な単語がデータベースにないことがわかりました。新しい単語を挿入したり、構造を編集したりできる API やツール、またはその他の方法はありますか? (私は Wordnet 3.0 を使用しています。)
ありがとう。
semantics - Word Semantic-Similarity (距離測定) Web サービス?
単語の意味類似性測定を提供する Web サービスはありますか?
私はDiscoのことは知っていますが、基盤が継続的に拡大しているサービスを好みます (プロジェクトで試したことがあれば、最も役に立ちます)。
WordNet ベースのアルゴリズムも知っていますが、プロジェクト リソースの一部としてそれをインストールして管理すると、負担が大きくなります。
php - PHPを使用して、ファイル内のパターンを別のファイルに存在する別の置換文字列に置き換えますか?
テキスト ファイルで wordnet のコロケーションを見つける必要があります。そのような文字列/コロケーションのリストが保存されています.今、私のテキストファイル(コーパスから)に、これらの文字列のいずれかが発生するかどうかを識別する必要があります. 問題は、POSタガーを使用しているため、複数単語のコロケーションが別々の単語と見なされるため、最初にコロケーションリストからコロケーションを取得し、それがテキストに含まれているかどうかを確認してから、コロケーションのスペースを次のような特殊文字に置き換える必要があることです_ したがって、pos tagger はそれを 1 つと見なします。リスト内のすべてのコロケーションのテキスト ファイルの内容に対して preg_replace を試しましたが、ブラウザがクラッシュするか、メモリ過負荷エラーが表示されます
c - C で WordNet ライブラリを使用するプログラムをコンパイルするとエラーが発生する
WordNet ライブラリのインストールに成功しました。現在、プログラムでライブラリを使用しようとしていますが、サンプル プログラムをビルドすることができません。ライブラリ検索パスが正しいのに、リンカ エラー (未定義の参照) が発生します。
エラーは次のとおりです。
これはメイクファイルです
サンプルプログラムです
WordNet ライブラリがインストールされている
リンカにさらに引数が必要かもしれないと思いますが、よくわかりません。誰かがこれに出くわしますか?正しいライブラリとライブラリ検索パスがあるにもかかわらず、未定義の参照エラーが発生する理由を知っている人はいますか?
java - WordNet 使用時の ExceptionInInitializerError
最近、WordNet への Java インターフェイス用に JWNL をダウンロードすることにしました。さまざまなチュートリアル ( http://jwordnet.sourceforge.net/handbook.htmlなど) に従って、WordNet (2.1) をダウンロードし、次に JWNL をダウンロードして、file_properties.xml の dictionary_path 行を WordNet へのパスに設定しました。
すべての jar をクラスパスに追加し、Eclipse でテスト用に次の単純なクラスを作成しました。
Eclipse で実行すると、次のエラーが発生します。
足りないものはありますか?私は JAWS のような代替手段を検討する準備をしていますが、問題を解決する方法があることを期待していました。
ありがとう!