問題タブ [quanteda]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R: Quanteda DFM、Sparse Document-Feature Matrix、オブジェクトからの正規表現の削除?
Quanteda パッケージは疎ドキュメント機能マトリックス DFM を提供し、そのメソッドにはremoveFeaturesが含まれています。dfm(x, removeFeatures="\\b[a-z]{1-3}\\b")
短すぎる単語を削除しようとしただけでなく、dfm(x, keptFeatures="\\b[a-z]{4-99}\\b")
十分に長い単語を保持しようとしましたが、機能しませんでした。基本的に同じことを行いました。つまり、短すぎる単語を削除しました。
Quanteda DFM オブジェクトから正規表現一致を削除するにはどうすればよいですか?
例。
サンプル DFM
r - R: Quanteda パッケージで CommonTerms を削除しますか?
removeCommonTerms 関数は、TM パッケージ用にここにあります。
ここで、Quanteda パッケージであまりにも一般的な用語を削除したいと思います。Document-feature マトリックスを作成する前に、または document-feature マトリックスを使用して、この削除を行うことができます。
R の Quanteda パッケージであまりにも一般的な用語を削除するには?
r - R: 2 つの Quanteda DFM スパース行列の行列乗算によって得られる空の dgCMatrix を初期化しますか?
私はこのような for ループを持っており、ここでソリューションを実装しようとしています。
でも今
wheremmm
がまだ存在しない場合、目標は と同じことを行うことですmmm <- t(apply(a, 1, sort, decreasing = TRUE))
。しかし、for ループの前に、mmm
otherwiseを初期化する必要がありますError: object 'mmm' not found
。との型は、aaa
2つの Quanteda DFM 行列の行列乗算によって与えられます。mmm
dgCMatrix
構造
aaaFunc
DFM %*% t(DFM)
DFM が Quanteda Sparse dfm-matrix である行列乗算によって与えられます。構造はそのようなものです
ここで説明したメソッドを使用した DFM のエラーは、R オブジェクトをその内容ではなくその構造などを複製することに関する一般的な質問です。
A.エラー
aaaFunc.mt[]<- NA
B.エラー
mySparseMatrix.mt[nrow(mySparseMatrix),]<-
C.エラー
replace(...,NA)
2 つの Quanteda DFM 行列の行列乗算によって得られる空の dgCMatrix をどのように初期化しますか?