2

アソシエーション ルールの第一歩を踏み出しました。

このトピックを見つけました ( Apriori アルゴリズムのスーパーマーケット データセット)。次に、回答2で提案されたデータを使用しようとしましたが、データセットの説明を見ると、実際のデータとの相関が保たれていないようです。

データセットについて、著者は次のように説明しています。

そして、私が見るデータの最初のレコードで:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29

2番目に:

30 31 32

これは、データセットが「匿名化」されているためだと思いますが、変数をデータに「変換」するにはどうすればよいですか?

4

1 に答える 1

1

ざっと見てみると、これは典型的な「バスケット」形式の元のデータのサブセットにすぎないと思います。各行はトランザクションであり、各番号はアイテムです。

いいえ、追加のデータ ソースがなければ、これらがどのアイテムであったかを知ることはできません。

そのため、アルゴリズムが実際のデータに対して何かを返すことをテストするのに最適ですが、が見つかったのかはわかりません。

supermarket.arffIIRC が Weka に付属しているファイルを参照してください。少なくともいくつかの製品カテゴリにラベルが付けられています (例: 「冷凍食品」)。

于 2013-05-23T09:17:30.237 に答える