4

私は「ソーシャルネットワークデータからの相関ルールの発見:セマンティックWebへのデータマイニングの紹介」というプロジェクトに取り組んでいます。ソーシャルネットワークデータベースから相関ルールを見つけるためのアルゴリズム(およびそのコード。PerlおよびRパッケージを使用して実装できると聞きました)の優れたソースを誰かが提案できますか?

データベースのスナップショットは、次のリンクで取得できます:https ://docs.google.com/uc?id=0B0mXGRdRowo1MDZlY2Q0NDYtYjlhMi00MmNjLWFiMWEtOGQ0MjA3NjUyZTE5&export=download&hl=en_US

データセットは次のリンクから入手できます:http://ebiquity.umbc.edu/get/a/resource/82.zip

私はこのプロジェクトに関してたくさん検索しましたが、残念ながらまだ何か役に立つものを見つけることができません。私が見つけた次のリンクはやや関連しています:

犯罪データ: http: //www.computer.org/portal/web/csdl/doi/10.1109/CSE.2009.435

あなたの助けは大歓迎です。

ありがとうございました、

4

3 に答える 3

4

さて、元のアソシエーションルールアルゴリズム(元々はIBM Almaden Research Centerで開発された)の最も広く使用されている実装は、Apriori、特にEclat、特にChristianBorgeltによるC実装です。

(アソシエーションルール(別名「頻繁なアイテムセット」または「マーケットバスケット分析」)に精通していない人のための簡単な要約。アソシエーションルールのプロトタイプアプリケーションは、スーパーマーケットデータなどの消費者トランザクションを分析します。ポリッシュソーセージを購入する買い物客の間で何パーセントそのうち黒パンも購入しますか?)

統計プラットフォームRをお勧めします。これは無料でオープンソースであり、そのパッケージリポジトリには、(少なくとも)アソシエーションルール専用の4つのライブラリが含まれており、すべて優れたドキュメントが含まれています。4つのパッケージのうち3つには、マニュアルと個別のライブラリが含まれています。Vignette(コード例を含む非公式の散文ドキュメント)。マニュアルとビネットの両方に、Rコードの多数の例が含まれています。

以下の4つのパッケージのうち3つを使用しましたが、これら3つを強くお勧めします。その中には、EclatとAprioriのバインディングがあります。これらのライブラリはR'パッケージ'として配布され、RのプライマリパッケージリポジトリであるCRANで利用できます。Rの基本的なインストールとセットアップは簡単です。Mac、Linux、およびWindows用のバイナリがあり、上記のリンクから入手できます。同様に、パッケージのインストール/統合は、統合プラットフォームに期待するのと同じくらい簡単です(ただし、以下にリストされている4つのパッケージのすべてにすべてのOSのバイナリがあるわけではありません)。

したがって、CRANでは、これらのパッケージはすべてアソシエーションルールのみに向けられています。


この4つのRパッケージのセットは、4つの異なるアソシエーションルール実装のRバインディングと、視覚化ライブラリで構成されています。

最初のパッケージであるarulesには、EclatとAprioriのRバインディングが含まれています。2番目のarulesNBMinerは、MichaelHahslerのアソシエーションルールアルゴリズムNBのバインディングです。3番目のルールシーケンスは、モハメッドザキのcSPADEのバインディングです。

これらの最後のものは、前の3つのパッケージのいずれかからの出力をプロットするための視覚化ライブラリであるため、特に便利です。ソーシャルネットワークの調査では、グラフの視覚化、つまりノード(データセット内のユーザー)とエッジ(ノード間の接続)の明示的な視覚化が見つかると思います。

于 2011-04-18T10:58:48.263 に答える
2

これはhttp://en.wikipedia.org/wiki/Association_rule_learningよりも少し広いですが、うまくいけば便利です。

興味深いかもしれないいくつかの初期のFOAF作業(SVD / PCAなど):

http://stderr.org/~elw/foaf/ http://www.scribd.com/doc/353326/The-Social-Semantics-of-LiveJournal-FOAF-Structure-and-Change-from-2004-to -2005 http://datamining.sztaki.hu/files/snakdd.pdf

また、 http: //www.amazon.com/Understanding-Complex-Datasets-Decompositions-Knowledge/dp/1584888326のCh.4は、グラフデータ構造に対する行列分解手法の適用に専念しています。強く推奨する。

最後に、Apache Mahoutは、大規模なデータマイニング、機械学習などに最適です。https://cwiki.apache.org/MAHOUT/dimension-reduction.html

于 2011-05-31T06:11:49.987 に答える
0

Javaコードが必要な場合は、私のWebサイトでSPMFソフトウェアを確認できます。頻繁なアイテムセットマイニング、アソシエーションマイニング、シーケンシャルパターンマイニングなどの45を超えるアルゴリズムのソースコードを提供します。

さらに、最も一般的なアルゴリズムを提供するだけではありません。また、レアアイテムセット、ユーティリティアイテムセット、不確実アイテムセット、非冗長アソシエーションルール、クローズドアソシエーションルール、間接アソシエーションルール、top-kアソシエーションルールなどの多くのバリエーションを提供します...

于 2012-04-15T19:15:49.640 に答える