問題タブ [market-basket-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - マーケット バスケットのアイテムをクラスターに分割するにはどうすればよいですか?
私は次のようなデータセットを持っています: (私は簡単な例を挙げましたが、実際のデータセットはもっと大きいです)
ここで、V1、V2、V3...Vn はアイテムで、1,2,3,4...1000 はトランザクションです。これらのアイテムを k 個のクラスターに分割して、各クラスターに、同じトランザクションで最も頻繁に一緒に表示されるアイテムがあるようにします。アイテムの各カップルが一緒に表示される回数を決定するために、クロステーブルを試しました。次の結果が得られました。
この小さな例では、2 つのクラスター (k=2) を作成して、クラスターに 2 つのアイテムを含める必要がある場合 (クラスター間のバランスを維持するため)、次のようになります。
Cluster1={V1,V4}
Cluster2={V2,V3}
なぜなら:
1) V1 は V4 (V1,V4)=3 > (V1,V3) > (V1,V2) でより頻繁に出現し、V4 についても同様です。
2) V2 (V2,V3)=5 > (V2,V4) > (V2, V1) で V2 がより頻繁に出現し、V3 についても同様です。
このパーティションをRで、より大きなデータセットに対してどのように行うことができますか?
r - R プログラミング: apply() 関数と kmeans() 関数でエラーが発生する
私は R でマーケット バスケット分析を行っています。その際、エルボー法で WSS を計算し、kmeans()
関数も使用していました。1 つの正規化されたデータ フレーム pc1 を使用し、PCA を計算してから、コードに次のコマンドを含めました。
次に、これを実行しているときに、関数を含むコードの 6 行目に次のエラーが表示されapply()
ます:-
get(as.character(FUN)、モード = "機能"、環境 = 環境) のエラー:
モード「機能」のオブジェクト「2013-12-09」が見つかりませんでした
そして次の行で私は得ています:-
2 番目のエラーは、クラスターの数が個別のポイントよりも多いことが原因であることは明らかですが、前のエラーと何か関係があるのでしょうか?
どんな種類の助けも高く評価されます。また、PCA と Elbow Test について学ぶための pdf の良いサイトまたはリンクを誰かが知っている場合 (例を含むマーケット バスケットの観点から) も役立ちます。
python - Python で ML を使用して購入ごとにユーザーをグループ化する
購入のデータセットがあります
これから、いくつかの「クラスター」を作成したいと思います。データから、ユーザー 1 と 2 は非常に似ており、ユーザー 3 と 4 は非常に似ているように見えます。
Python の機械学習でこの分析を作成する方法がわかりません。
たとえば、次のような距離になると思います
そのため、各ユーザーが他のユーザーとどの程度似ているかを判断できます。
私が欲しいのは、さまざまなユーザーが購入に基づいて特定のグループに属しているかどうかを判断することです。たとえば、一部のユーザーが赤ちゃん関連のアイテムを多く購入する場合、そのユーザーは新しい母親/父親である可能性がありますが、ソフトウェア関連の本を多く購入するユーザーは IT プロフェッショナル/学生である可能性があります。