このパッケージを使用して、arules
POS 小売データで関連付けルールを見つけています。データベースからトランザクションの詳細を抽出し、transaction
オブジェクトに配置しています。私は初めてで、トランザクション オブジェクトにデータ フレームをarules
設定する方法を理解しようとしています。itemInfo
今のところ、コンテキストをほとんど提供しないtransaction
とitem ID
s (両方とも数値) を取り込んでいます。商品の説明と商品の階層レベルを追加できるようにしたいと考えています。
以下は、私が今日使用しているプロセスです。
データは、次の形式でデータベースから取得されます。
Transaction_ID Item_ID -------------- ----------- 100 1 100 2 100 3 101 2 101 3 102 1 102 2
transaction
オブジェクトを作成するには、arules
ドキュメントで説明されているように、次のコマンドを使用しています。txdata <- as(split(txdata[, "Item_ID"], txdata[, "Transaction_ID"]), "transactions")
注: の数値が必要であることがわかりました
Item_ID
。そうしないと、文字列を使用してパフォーマンスに重大な問題が発生します (因数分解された文字列を使用すると分割のパフォーマンスが低下するため)。アソシエーション ルールの作成と表示
rules <- apriori(txdata, parameter = list(support=0.00015, confidence=0.5)) inspect(head((sort(rules, by="confidence")), n=5))
ルールが戻ってくると、 によって一覧表示されItem_ID
ますが、これは役に立ちません。ID
および/または説明でそれらを表示できるようにしたい。arules
また、パッケージに組み込まれている集計機能も活用したいと考えています。