問題タブ [quanteda]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
450 参照

r - R: Quanteda DFM、Sparse Document-Feature Matrix、オブジェクトからの正規表現の削除?

Quanteda パッケージは疎ドキュメント機能マトリックス DFM を提供し、そのメソッドにはremoveFeaturesが含まれています。dfm(x, removeFeatures="\\b[a-z]{1-3}\\b")短すぎる単語を削除しようとしただけでなく、dfm(x, keptFeatures="\\b[a-z]{4-99}\\b")十分に長い単語を保持しようとしましたが、機能しませんでした。基本的に同じことを行いました。つまり、短すぎる単語を削除しました。

Quanteda DFM オブジェクトから正規表現一致を削除するにはどうすればよいですか?

例。

サンプル DFM

0 投票する
1 に答える
446 参照

r - R: Quanteda パッケージで CommonTerms を削除しますか?

removeCommonTerms 関数は、TM パッケージ用にここにあります。

ここで、Quanteda パッケージであまりにも一般的な用語を削除したいと思います。Document-feature マトリックスを作成する前に、または document-feature マトリックスを使用して、この削除を行うことができます。

R の Quanteda パッケージであまりにも一般的な用語を削除するには?

0 投票する
1 に答える
728 参照

r - R: 2 つの Quanteda DFM スパース行列の行列乗算によって得られる空の dgCMatrix を初期化しますか?

私はこのような for ループを持っており、ここでソリューションを実装しようとしています。

でも今

wheremmmがまだ存在しない場合、目標は と同じことを行うことですmmm <- t(apply(a, 1, sort, decreasing = TRUE))。しかし、for ループの前に、mmmotherwiseを初期化する必要がありますError: object 'mmm' not found。との型は、aaa2つの Quanteda DFM 行列の行列乗算によって与えられます。mmmdgCMatrix

構造

aaaFuncDFM %*% t(DFM)DFM が Quanteda Sparse dfm-matrix である行列乗算によって与えられます。構造はそのようなものです

ここで説明したメソッドを使用した DFM のエラーは、R オブジェクトをその内容ではなくその構造などを複製することに関する一般的な質問です。

A.エラーaaaFunc.mt[]<- NA

B.エラーmySparseMatrix.mt[nrow(mySparseMatrix),]<-

C.エラーreplace(...,NA)

2 つの Quanteda DFM 行列の行列乗算によって得られる空の dgCMatrix をどのように初期化しますか?