問題タブ [text2vec]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 各ドキュメントの単語ベクトルを取得する
私は text2vec パッケージに出くわしました.Rに単語の埋め込みを実装しています.私はそれをうまく試してきました. ただし、H2O(python)で見つけたのとまったく同じように、各ドキュメントに単語ベクトルを実装しようとしていますhttps://github.com/h2oai/h2o-tutorials/blob/master/h2o-world-2017/nlp/AmazonReviews. ipynb
このチュートリアルの 21 行目では、単語ベクトルが平均化されてから、特徴としてモデルに使用されます。
問題はコードについてではなく、単語ベクトルを取得して各ドキュメントに割り当てる方法についてだと思います。それらを機能としてフィードできるように、ここで説明したチュートリアルに従っているだけです。http://text2vec.org/glove.html
tf-idf - 文字 n-gram 機能を使用して tf-idf マトリックスを作成するにはどうすればよいですか?
text2vec パッケージを使用して、文字 n-gram 機能を備えた tdf-idf マトリックスを作成するにはどうすればよいですか?
r - Rのtext2vecパッケージからドキュメント用語マトリックスを使用してsvmプロットを作成するには?
ここで説明されているように、text2vec パッケージを使用して語彙ドキュメント用語マトリックスを作成しています: http://text2vec.org/vectorization.html#vectorization
特に、e1071 パッケージの SVM を使用しています。チュートリアルで提供されているものと同様の語彙用語ドキュメント マトリックスを作成し、次のコードを使用して SVM 分類器をトレーニングしました。
ここで、dtm_train はドキュメント ターム マトリックスです。
次のような同様の方法で、プロット関数を使用してモデルをプロットする方法を考えていました。
プロット(分類子、データ)。
私は次のようにそれをやろうとしました:
これにより、次のエラーが返されます。
plot.svm(svm_classifier, dtm_train) のエラー: 式がありません。
nlp - R text2vec パッケージ内 - LDA モデルによって生成されたトピックを関連ドキュメントに割り当てる方法
Rで実装されたLDAモデルでtext2vecパッケージを使用していますが、各ドキュメントをトピックに割り当てる方法を考えています
この後、各ドキュメントを関連トピックに割り当てたいと思います。トピックの下に用語のリストを取得していますが、マッピング方法はわかりません。