問題タブ [text2vec]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
360 参照

r - text2vec dtm をファイル (csv または svmlight) に書き込みます

今日、text2vec パッケージに出会いました。これは、特定の問題にまさに必要なものです。ただし、text2vec で作成された dtm を何らかの出力ファイルにエクスポートする方法がわかりませんでした。私の最終的な目標は、text2vec を使用して R で機能を生成し、結果のマトリックスを H2O にインポートしてさらにモデリングすることです。H2O は、CSV または SVMLight 形式のいずれかを読み取ることができます。

最初に作成した987753 x 8806 sparse Matrix of class "dgCMatrix", with 3625049 entriesのは で、かなり大きいです。大きすぎるため、as.matrix() を使用して CSV に書き出すことはできません。SVMLight 形式で簡単に書き出せるのではないかと思ったのですが、動作するライブラリが見つかりませんでした。この出力を H2O に読み込むことができるファイルに取得するための他のオプションはありますか?

0 投票する
2 に答える
1702 参照

r - text2vec グローブ関数を使用して R エラーを解決する方法: 未使用の引数 (grain_size = 100000)?

ドキュメントの text2vec ビネットとここで作業して、いくつかのツイートの単語埋め込みを作成しようとしています:

与えられたガイドにほとんど従いました:

ただし、実行するたびにglove_model、次のエラーが発生します。

GloVe代わりに使ってみたのですが、text2vec パッケージを再インストールしてrequireing しても、R が関数を見つけられないというエラーが発生します。

データの書式設定の問題ではないことを確認するために、データを使用してコードを実行しようとmovie_reviewしたところ、同じ問題が発生しました。念のため、追加でgrain_size引数を指定してみましたが、同じエラーになります。Git リポジトリの問題を確認しましたが、このサイトやインターネット クエリには何も表示されませんでした。

他の誰かがこれに遭遇しましたか、それとも新しい人の問題ですか?