問題タブ [rweka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RStudio とは異なる結果を提供する Knitr
再現性のために、「tm」と「RWeka」を使用して、Knitr を使用して初期テキスト マイニングを行っています。
2 つのテキスト ファイルに基づいてコーパスの用語とドキュメントのマトリックスを取得しようとしていますが、コードを RStudio で実行した場合と、それを HTML ファイルに編んだ場合では、プロセスの結果が異なります。
...他のドキュメント出力を試してみると、PDF と Word の出力:
RStudioに同意します。
そして、HTML出力が必要です....
何が起こっているのでしょうか?
これが.Rmd
コードです
```
sessionInfo() R バージョン 3.2.3 (2015-12-10) プラットフォーム: x86_64-apple-darwin13.4.0 (64 ビット) 実行環境: OS X 10.11.4 (El Capitan)
ロケール: [3] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
付属の基本パッケージ: [3] stats グラフィックス grDevices utils データセット メソッド base
その他の添付パッケージ: [3] R.utils_2.2.0 R.oo_1.20.0 R.methodsS3_1.7.1 dplyr_0.4.3 xtable_1.8-0
[6] pander_0.6.0 RWeka_0.4-24 SnowballC_0.5.1 tm_0.6-2 NLP_0 .1-9
[11] Knitr_1.12.3
java - Mac OS X El Capitan の R で FSelector パッケージを使用できない
現在、OS X El Capitan バージョン 10.11.3 を使用しています。
R で使用しようとすると、次のようlibrary(FSelector)
なエラーが表示されます。
library(Rweka)
また、とを試したときにも同じことが起こりましたlibrary(Rwekajars)
。
なぜこれが起こり、どのように解決するのですか?
r - Rで重要な用語(コーパス)を別の用語に検索する
コードを提供しなかったため、以前にこの質問をしたところ、否定的なフィードバックがありました。私は一日中試行錯誤して過ごしましたが、今は問題が発生しています。
このコードは、Stackoverflow "Tyler Rincker" のユーザーによって取得されました <- 彼に感謝します!
コードは次のとおりです。
私の問題は、コーパスでバイグラムまたはトリグラム (2 または 3 語) を検索したいということです。
このコード行を実行すると:
「1」の頻度を示すこの結果が得られます。
ただし、キータームが 1 単語のみの場合:
コードは正常に機能しており、次の結果が得られます。
どうもありがとう!うまくいけば、誰かが助けてくれるでしょう。
r - RWeka はキャレットまたはおそらく %dopar% では機能しません
caret
パッケージの R 教科書である Applied Predictive Modeling の著者による演習を完了しています。train
関数をメソッドM5P
またはで動作させることができませんM5Rules
。
コードは手動で正常に実行されます。
同じデータとコントロール (「ルール」を「M」に交換 - M を調整パラメーターとして指定できないのはなぜですか? ) は終了しません。
本の例も終了しません。
これは、少なくとも私にとっては、RWeka で並列バックエンドを使用する際の問題かもしれません。上記の私の例は、 では終わりません%dopar%
。
各例の前に実行sudo R CMD javareconf
し、Rstudio を再起動しました。
r - RWeka でバックアップ トークナイザ スイッチを実装するには?
R-tm-Rweka パッケージを使用してテキスト マイニングを行っています。私の目的には不十分な単一の単語で tf-tdm を構築する代わりに、ngram を抽出する必要があります。@Ben関数を使用してトリグラムTrigramTokenizer <- function(x) NGramTokenizer(x, Weka_control(min = 2, max = 3))
tdm <- TermDocumentMatrix(a, control = list(tokenize = TrigramTokenizer))
を抽出しました。出力に明らかなエラーがあります。以下を参照してください。4 語、3 語、2 語のフレーズをピックアップします。理想的には、4 語の名詞句のみをピックアップし、残り (3 語および 2 語) を削除する必要があります。Python NLTK にはバックアップ トークナイザー オプションがあるように、このソリューションを強制するにはどうすればよいですか?
抽象戦略 ->this is incorrect
>
抽象戦略ボード ->incorrect
抽象戦略ボードゲーム -> this should be the correct output
アクセント エグゼクティブ
アクセント エグゼクティブ シンプル
アクセント エグゼクティブ シンプル コメント
どうもありがとう。
java - R パッケージの RWeka のエラー
SO と他の場所を検索しましたが、サポートされていない major.minor バージョン 51 エラーを修正するものは何もありません。Java 8 をアンインストールし、Java 7 をインストールしました。ご協力ありがとうございました。私は使用しています: R 3.3.1 Java 8.91 OSX, el capitan library(NLP) library(tm) library(RWeka) library(rJava) library((RWekajars)) library(parallel) options(mc.cores=1)エラーの原因となった R コード:
r - R エラーの n-gram: 無効な 'times' 引数
この例に従おうとしていますが、エラーが発生しました。
何か案は?
r - RWeka - R 3.3.0 の J48 関数
私は解約プロジェクトに取り組んでおり、J48 ツリー関数に出会いました。依頼されたパッケージは RWeka と party でした。しかし、ライブラリ(RWeka)をロードしているときにエラーが発生します
この問題の回避策はありますか?