0

小さな CRM システムを実装しています。そして、機会と傾向を予測して見つけるためのデータマイニングの概念は、そのようなシステムに不可欠です。データ マイニングのアプローチの 1 つにクラスタリングがあります。これは非常に小さな CRM プロジェクトであり、Java を使用してデータベースから情報を取得するためのインターフェイスを提供します。

私の質問は、顧客をデータベースに挿入するときに、データベースへの途中で顧客にタグを付けることができるテキストフィールド、つまり登録ポイントがあることです。

タグ付け手法をクラスタリングと見なしますか? もしそうなら、これはデータマイニング技術ですか?

データマイニングを可能にするJava Data Mining APIなどの複雑なAPIがあると確信しています。しかし、私のプロジェクトのために、stackoverflow のようなキーワードでユーザーをタグ付けすることで、質問を投稿する際にキーワードをタグ付けできるかどうかを知りたかっただけです。これらのタグ付けされた単語を使用すると、検索によって傾向やパターンを簡単に見つけることができるためです。

4

1 に答える 1

1

To make it short, yes, tags are additional information that will make data mining easier to conduct later on.

They probably won't be enough though. Tags are linked to entities and, depending on how you compute them, they might not show interesting relations between different entities. With your tagging system, the only relation usable I see is 'has same tag' and it might not be enough.

Clustering your data can be done using community detection techniques on graphs built using your data and relations between entities. This example is in Python and uses the networkx library but it might give you an idea of what I'm talking about: http://perso.crans.org/aynaud/communities/

于 2013-03-07T09:31:44.173 に答える