問題タブ [rweka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 多変量時系列のアソシエーション ルール マイニング
時間とともに変化する複数の変数を含むデータセットがあります。アソシエーション マイニング アルゴリズムを実行して、パターンが同時に変化する変数をマイニングしたいのですが、Temporal Association Mining に何かがあるようですが、これにはパッケージが見つかりませんでした。CRAN タスク ビューで言及されているトピックでもありません。
r - RにRWekaパッケージをインストールできませんでした
RにRWekaパッケージをインストールするさまざまな方法を試しましたが、成功しませんでした。
さまざまな方法を試しましたが、RWeka をインストールできませんでした。
1.普通にインストール
2.URLからインストール
3. ローカルからインストール (zip ファイルをダウンロードしてディレクトリに配置した後)
誰かがこれで私を助けてくれますか? どうもありがとう
r - RWeka はスパース項を削除します
RWeka を使用して trigram と quadgram モデルを作成しています。私が気づく奇妙な動作があります
まばらな用語を削除すると、上記の〜100万行が8307に縮小されます
Quadgram の場合、削除してもまったく影響はありません
まばらな用語を削除した後、100 万項目あります。
これは正しくありません。
何か間違ったことをしている場合はお知らせください
よろしくガネーシャ
r - RWeka 問題編み HTML
RstudioでKnitrを使用してマークダウンファイルをhtmlに編成しようとすると、RWekaライブラリに関連する以下のエラーが発生します。どんなヒントでも大歓迎です。
エラー: .onLoad が「rJava」の loadNamespace() で失敗しました。詳細:
呼び出し: fun(libname, pkgname)
エラー: JAVA_HOME をレジストリから判別できません14 ~
20 行目から終了します (Milestone_Report.Rmd)
エラー: パッケージまたは名前空間の読み込み「RWeka」の
実行に失敗しました実行が停止しました
r - R を使用して最も頻繁な ngram を抽出する効率的な方法
次の tm+RWeka コードを使用して、テキスト内で最も頻繁に使用される ngram を抽出しています。
問題なく動作していますが、データが大きすぎる場合はどうなりますか? より効率的な計算方法はありますか?DF$sums
さらに、変数がより多い場合(例:100)、コード行をどのように記述できますか。確かに、次のものよりもエレガントなものがあります。
ありがとうございました
編集: TermDocumentMatrix から最も頻繁な ngram を抽出tdm
し、値を使用してデータフレームを作成する方法があるかどうか疑問に思っています。私がやっていることは、すべての ngram を含むデータフレームを作成し、最も頻繁に使用される値を取得することです。これは最良の選択ではないようです。
r - データセットで RWeka パッケージを使用するには?
そのため、ランダムなデータセットをオンラインで生成し、C4.5 アルゴリズムを適用する必要があります。
RWeka パッケージとそのすべての依存関係をインストールしましたが、実行方法がわかりません。
誰かがチュートリアルへのリンクを手伝ってくれますか? RWeka のドキュメント以外のもの。または、その動作を理解するための R のサンプル C4.5 コードはありますか?
ありがとうございました
r - R および MovieLense データセットにおける RWeka J48 分類の問題
Movielense ユーザー テーブルの人口統計データを分類したいのですが、J48 の結果が変です。データを C5.0 で分類すると、すべて問題ありませんでしたが、このアルゴリズム (j48) に取り組む必要があります。
私のデータの構造は以下のようなものです
そしてデータの頭は
を除くすべての列user_id
はnominal type
、あるべきであり、あるべきですfactor in R
分類コード:
集計結果の間違った表は
モデルをC5.0に適合させると、両方のアルゴリズムを除いて以下のような結果になります
もっと試す
- データの構造を変更し、因子列を別の列に変換しましたが、何も変わりません
- 私
C controller value
は結果が少し良くなるように変更しますC=0.75
が、それは完全に間違っています
正規化およびデータの変更後のイベント 何も起こらなかった