さて、元のアソシエーションルールアルゴリズム(元々はIBM Almaden Research Centerで開発された)の最も広く使用されている実装は、Apriori、特にEclat、特にChristianBorgeltによるC実装です。
(アソシエーションルール(別名「頻繁なアイテムセット」または「マーケットバスケット分析」)に精通していない人のための簡単な要約。アソシエーションルールのプロトタイプアプリケーションは、スーパーマーケットデータなどの消費者トランザクションを分析します。ポリッシュソーセージを購入する買い物客の間で何パーセントそのうち黒パンも購入しますか?)
統計プラットフォームRをお勧めします。これは無料でオープンソースであり、そのパッケージリポジトリには、(少なくとも)アソシエーションルール専用の4つのライブラリが含まれており、すべて優れたドキュメントが含まれています。4つのパッケージのうち3つには、マニュアルと個別のライブラリが含まれています。Vignette(コード例を含む非公式の散文ドキュメント)。マニュアルとビネットの両方に、Rコードの多数の例が含まれています。
以下の4つのパッケージのうち3つを使用しましたが、これら3つを強くお勧めします。その中には、EclatとAprioriのバインディングがあります。これらのライブラリはR'パッケージ'として配布され、RのプライマリパッケージリポジトリであるCRANで利用できます。Rの基本的なインストールとセットアップは簡単です。Mac、Linux、およびWindows用のバイナリがあり、上記のリンクから入手できます。同様に、パッケージのインストール/統合は、統合プラットフォームに期待するのと同じくらい簡単です(ただし、以下にリストされている4つのパッケージのすべてにすべてのOSのバイナリがあるわけではありません)。
したがって、CRANでは、これらのパッケージはすべてアソシエーションルールのみに向けられています。
この4つのRパッケージのセットは、4つの異なるアソシエーションルール実装のRバインディングと、視覚化ライブラリで構成されています。
最初のパッケージであるarulesには、EclatとAprioriのRバインディングが含まれています。2番目のarulesNBMinerは、MichaelHahslerのアソシエーションルールアルゴリズムNBのバインディングです。3番目のルールシーケンスは、モハメッドザキのcSPADEのバインディングです。
これらの最後のものは、前の3つのパッケージのいずれかからの出力をプロットするための視覚化ライブラリであるため、特に便利です。ソーシャルネットワークの調査では、グラフの視覚化、つまりノード(データセット内のユーザー)とエッジ(ノード間の接続)の明示的な視覚化が見つかると思います。