問題タブ [apriori]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - spmf からのアソシエーション ルールの R サブセット
コード:
fp-growth を使用して spmf から取得した csv ファイルで上記のコードを試して、関連付けルールを取得しています。lhs に「1」が含まれるすべてのルールを削除したいのですが、うまくいきません。
csv ファイル:
2 ==> 1 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
1 ==> 2 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
3 ==> 1 #SUP: 2 #CONF: 0.5 #LIFT: 1
1 ==> 3 #SUP: 2 #CONF: 0.66667 #リフト: 1
3 ==> 2 #SUP: 2 #CONF: 0.5 #LIFT: 1
2 ==> 3 #SUP: 2 #CONF: 0.66667 #リフト: 1
2 3 ==> 1 #SUP: 1 #CONF: 0.5 #LIFT: 1
1 3 ==> 2 #SUP: 1 #CONF: 0.5 #LIFT: 1
1 2 ==> 3 #SUP: 1 #CONF: 1 #LIFT: 1.5
3 ==> 1 2 #SUP: 1 #CONF: 0.25 #LIFT: 1.5
2 ==> 1 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1
1 ==> 2 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1
r - Rでテストトランザクションにアソシエーションルールを適用する方法は?
トレーニングとテストを含む 2 つのデータセットがあります。トレーニング データセットについては、以下のように多くの関連付けルールを抽出しました。ここで、これらのルールをテスト トランザクション データセットに使用したいと思います。これらのルールに一致するトランザクション ID を見つける必要があります。助けて!
data-mining - データマイニングにおける最小限のサポートと最小限の信頼
最小サポートと最小信頼度がマイニング アソシエーション ルールで自動的に決定されるかどうかを知りたいですか? もしそうなら、リソースへのヒントやポインタは素晴らしいでしょう.
r - クラスルールのオブジェクトをRのデータフレームに変換する
apriori
データをマイニングし、一連のルールを提供する関数の出力があります。さらに処理するためにデータフレームに変換したい。ルール オブジェクトは次のようになります。
データフレームを使用してルールオブジェクトを作成できます。データフレームは次のようになります。
これを使用して出力変数を取得できます。
中古arules
パッケージありました。dput(output)
これを与える:
r - arules/apriori を使用した rhs のフィルターが機能しない
バイナリ マトリックスで arules::apriori を使用しており、RHS に特定の 1 つの列を持つルールのみを作成したいと考えています。これはドキュメントで指定されていますが、機能していないようです。これを取得するために事後的にフィルタリングするのは簡単ですが、最初にすべてのルールを計算するために多くの計算時間を浪費します。
例:
rules には 3378 個のルールが含まれるようになりました
rules.sub には 172 のルールが含まれています
私の実際のデータでは、数百万の結果から最大 4000 の結果になりましたが、これは大きな違いです。
r - R でアプリオリ関数を使用したエラー メッセージ - トランザクションでリストを強制できません
私はstackoverflowが初めてなので、質問を読むときにそれを考慮してください...助けてくれてありがとう。
Rでアプリオリ関数を実行しようとしていますが、エラーが発生します:
名前が重複しているトランザクションでリストを強制することはできません
データを CSV ファイルにフォーマットする方法に問題があるのか、それともプログラムのステップが抜けているのかわかりません。
- CSVファイルを読み込む
mydata<-lapply(mydata, as.factor)
rules<-apriori(mydata,parameter=list(supp=.01,conf=.7))
asMethod(object) のエラー: アイテムが重複しているトランザクションでリストを強制できません
私のデータは、利用可能な製品 (列) ごとに 1 または 0 のトランザクションのリストとしてフォーマットされています。
python - Pythonでアプリオリアルゴリズムのk-itemsetを生成する方法
Python でコーディングを試みるのはこれが初めてで、Apriori アルゴリズムを実装しています。私は 2-itemset まで生成しました。以下は、1-itemset のキーを組み合わせて 2-Itemsets を生成するために必要な関数です。
この関数をジェネリックにするにはどうすればよいですか? つまり、辞書のキーとタプルに必要な要素の数を渡すことにより、アルゴリズムはキーを使用して可能なすべての n-number(k+1) サブセットを生成する必要があります。セットのユニオンが可能であることは知っていますが、本質的に辞書のキーであるタプルのユニオンを行う方法はありますか?
たとえば、最初の辞書が次のようになっている場合: {key, value} --> 値は頻度です
このディクショナリのキーを取得し、上記の候補_生成関数に渡します。これにより、2 項目セットのサブセットが生成され、キーが出力されます。次に、キーを関数に渡し、元のデータベースと比較して頻度を見つけ、次の出力を取得します。
上記のキーから 3 項目セットのサブセットを生成するにはどうすればよいですか。
r - R.アプリオリ。ルール内の属性の名前を知るためにデータを前処理する
データセット「大人」を使用しています。 http://archive.ics.uci.edu/ml/datasets/Adult apriori を使用して頻繁にルールを取得し、リフトで並べ替えました。
実行すると
以下を取得します。
等
たとえば、ルールでは次のようになります。
それとそれがどの属性であるかをどのように知ることができ0
ます13
か? データセットの説明とデータ自体を見たので、それ13
は教育番号で0
あり、資本損失であると思いますが、2つ以上の属性が同じ範囲を持つ場合があるため、それらを区別する方法がわかりません.
私はここで読みました:ルールで生成されたアイテムの列名/属性をどのように知ることができますか?問題はデータを前処理していないことです。それで、どうすればそれを行うことができますか?
どうもありがとうございました!
text - テキストのアプリオリアルゴリズム
データ マイニング コースを受講しapriori algorithm
ましたが、テキスト、つまり文字列を含むデータ セットに対して を実行する必要があります。
apriori アルゴリズムを実行するためのコードやヘルプを入手できますか?
前もって感謝します