問題タブ [conceptnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - どちらが良いですか?OpenCyc または ConceptNet?
私は、他の同様の概念を見つけるために文の概念を認識する必要がある NLP プロジェクトを行っています。これは、既に持っているリストから単語の価数を推測するために行います。WordNet を使い始めましたが、多くの矛盾した結果が得られました。矛盾した結果とは、矛盾した原子価を持つ単語展開を意味します。
だから今、ConceptNet と OpenCyc を調べています。私はすでに ConceptNet を実装しましたが、すべてがとても簡単で気に入っています。問題は、OpenCyc のデータベースがはるかに大きく、論理的に厳格であるように見えることです。これは、WordNet で非常に多くの「矛盾」を見つけたときに重要です...しかし、試したことがないのでわかりません。
OpenCyc を実装する (私にとってはかなりの) 努力をする価値があるかどうか、または単語の価数を推測するのに ConceptNet が十分に優れているかどうか、誰か教えてもらえますか? 彼らはそんなに違いますか?
必要に応じて、さらに詳しく説明させていただきます。今のところ短くしようとしています!
ありがとう!
java - Java による ConceptNet データベース接続
ConceptNet データベースと Java を接続する方法を知っている人はいますか? さまざまなチュートリアルを検索し、さまざまなフォーラムをチェックしましたが、それでも正しい方法論が見つかりませんでした。
また、Java を使用して ConceptNet との間でデータを取得および投稿するにはどうすればよいですか。
JSON または Flat Csv を使用することでクエリの応答が得られると言う人もいますが、私はこれら 2 つのテクノロジや、ConceptNet データベースと Java での使用方法に慣れていません。
知ってる人いたら回答よろしくお願いします...
python - ConceptNet: ローカルでの単純なクエリ
私は ConceptNet をまったく初めて使用します。
Web APIが提供するのと同じデータをローカルでクエリするにはどうすればよいですか? Web API フィールドの背後で呼び出される関数は何ですか?
python - Conceptnet Numberbatch (多言語) OOV 単語
私は (フランス語のコーパスで) テキスト分類の問題に取り組んでおり、さまざまな Word Embeddings を試しています。私は ConceptNet が提供するものに非常に興味があったので、試してみることにしました。
私は自分の特定のタスクに特化したチュートリアルを見つけることができなかったので、彼らのブログからアドバイスを受けました:
ConceptNet Numberbatch の使用方法を教えてください。
できるだけ簡単にするには:
セマンティック ベクトルを使用する NLP の機械学習に関する任意のチュートリアルに取り組みます。word2vec を使用するように指示されている部分に移動します。(特に詳しいチュートリアルでは、GloVe 1.2 を使用するように指示される場合があります。)
ConceptNet Numberbatch データを取得し、代わりに使用します。他の言語にも一般化されるより良い結果を取得します。
以下に私のアプローチを示します (「numberbatch.txt」は、推奨される多言語バージョンを含むファイルであることに注意してください: ConceptNet Numberbatch 19.08):
単語が存在するかどうかをテストすることから始めました。
「 fille」(フランス語で女の子)のような簡単な単語が見つからないことに驚きました。次に、コーパスからすべての OOV 単語を出力する関数を作成しました。結果を分析すると、さらに驚きました: 22,000 を超える単語が見つかりませんでした (「nous」(私たち)、「être」(~になる) などの単語を含む)。
OOV ワードのGitHub ページで提案されているアプローチも試しました(結果は同じです)。
語彙外戦略
ConceptNet Numberbatch は、なじみのない単語が存在する場合のパフォーマンスを向上させる語彙外戦略で評価されます。この戦略は、ConceptNet コード ベースに実装されています。次のように要約できます。
言語が英語ではない未知の単語が与えられた場合、英語の埋め込みで同等のスペルの単語を検索してみてください (英語の単語はすべての言語のテキストに含まれる傾向があるため)。
未知の単語が与えられた場合、末尾から文字を削除し、それが既知の単語の接頭辞かどうかを確認します。もしそうなら、それらの既知の単語の埋め込みを平均します。
プレフィックスがまだ不明な場合は、既知のプレフィックスが見つかるまで末尾から文字を削除し続けます。1文字残ったらギブアップ。
私のアプローチで何か間違ったことをしていますか?