問題タブ [arules]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R での Arules シーケンス マイニングの主なシーケンス
R の arulesSequence パッケージの cspade アルゴリズムからサブシーケンスを削除する方法、たとえば、私のデータ (Sample.txt) が以下の場合
列名: sequenceID、EventID、size、Item
以下の arulesSequence コード行を実行した後
間のアイテムを失うことなく完全な長さのシーケンスを見つける方法は?
データから、Aから始まる主な全長配列はA(1)、A→B(1)、A→B→C(1)、A→B→C→D(0.67) )、どうすれば中間のサブシーケンスを削除して、前述の結果を得ることができますか。
ここでの課題は、B、B->C などの間に形成されるシーケンスを削除する方法と、A->B->D のようなシーケンスを削除する方法です (ここでは、実際のシーケンスを失います。アイテム C は破棄されます)。 )
r - R のルール パッケージを使用したアソシエーション ルール マイニング
R でパッケージを使用してアソシエーション ルールを見つけようとしてarules
います。csv ファイルを使用してトランザクション オブジェクトを作成しています。間違ったアイテム セットを取得しています。データはこんな感じ
項目 4 と 5 を見ると、それらは同じですが、引用符のために異なる扱いになっています。項目 6 と 7 の場合も同様です。
これを解決する方法、またはこれが起こっている理由はありますか?
r - R プログラミングでルール トランザクション データをアイテム マトリックスに変換する
以下のようなトランザクション形式で 100,000 行のデータセットがあります
以下のようにマトリックス形式に変換したい(またはTRUE / FALSEフラグ)
次の手順を試しました
しかし、私のリスト変換では、出力を次のように取得しています
したがって、一部の行は完璧ですが、一部の行では、一意の ID が \t および \n を使用してムービー リストに追加されています。
以下の形式のリストが欲しい 9C05-EE9B44E8C18F c("Bruce Almighty","Iron Man","Toy Story")
このようにして、必要な結果を簡単に達成できると思います。あなたの助けを本当に感謝します.
r - Rでテストトランザクションにアソシエーションルールを適用する方法は?
トレーニングとテストを含む 2 つのデータセットがあります。トレーニング データセットについては、以下のように多くの関連付けルールを抽出しました。ここで、これらのルールをテスト トランザクション データセットに使用したいと思います。これらのルールに一致するトランザクション ID を見つける必要があります。助けて!
r - データ形式によっては R ルールがフリーズする
R のルール パッケージで問題に直面しています。スーパーマーケット データセットでマーケット バスケット分析を実行しようとしています。次の形式のデータを使用する場合:
数十万行をロードしても、すべて正常に動作します:) ...しかし、次の形式でデータをロードする必要があります。
250 行しかロードしていない場合でも、システムがフリーズします... この形式のデータをルールで使用できますか?
何か助けはありますか?前もって感謝します。
r - arules での 1 ステップ対 2 ステップの関連付けルール マイニング - なぜ違うのですか?
私の理解では、Apriori アルゴリズムは、最初にサポートのしきい値を満たすすべての頻度の高いアイテムセットを見つけてから、最小の信頼度も満たす頻度の高いアイテムセットから強力な関連付けルールを生成することによって機能します。
したがって、R パッケージのルールでは次のようになると予想されます。
txs <- as(inputDataTable,"transactions")
itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets"))
rules <- ruleInduction(itemsets)
と
txs <- as(inputDataTable,"transactions")
rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))
は同じルールになりますが、2 番目の例ではより多くのルールが見つかり、その理由がわかりません。
これがなぜなのか説明できる人はいますか?私は今しばらくそれについて頭を悩ませようとしています..