9

データマイニングの分野で、「類似性」と呼ばれる特定の下位分野はありますか? はいの場合、それは何を扱いますか。例、リンク、参照は役に立ちます。

また、この分野は初めてなので、データ マイニングと人工知能がどれほど密接に関連しているかについて、コミュニティの意見を求めています。それらは同義語ですか、一方は他方のサブセットですか?

知識を共有していただきありがとうございます。

4

5 に答える 5

9

データマイニングの分野で、「類似性」と呼ばれる特定の下位分野はありますか?

はい。データ マイニングと機械学習には、メトリック学習と呼ばれる特定のサブフィールドがあり、データ インスタンス間でより優れた距離メトリックを学習することを目的としています。

次の概念のいずれかを知っていますか?

ユークリッド距離

マハラノビス距離

ピアソン相関

コサイン類似度ここ

カーネル機能

これらがわかると、「類似性」とは何かがわかります。

データマイニングと人工知能がどれほど密接に関連しているかについて、コミュニティの意見をお願いします。

何がデータマイニングで何がAIなのかを区別するのは非常に困難です。この分野に慣れていないときは、この質問について議論しないでください。データマイニングで10個のアルゴリズムを学び、AIの本を何冊か読めば、その違いと関係がわかるでしょう。

于 2010-05-22T09:24:23.257 に答える
2

「類似性」の概念の重要性を強調するだけです。

データマイニング (AI、機械学習、モデリングなど) とは、ある機能を最大値または最小値にすることです。最善の最適化/学習/マイニング アルゴリズムと間違った関数を使用すると、完全なゴミが得られます。「valueS」ではなく「value」を使用していることに注意してください。これは、(私の知る限り)複数の値を最適化できるアルゴリズム(計算またはその他)がないためです。しかし、私たちの宇宙では、複雑な最適化が 1 次元の最適化よりも頻繁に行われます (私たちは豊かで、若く、健康になりたいと考えています)。そのため、多数の類似性やその他のスコアリング関数が存在します。そしてそれが、それらのどれもが「正しいもの」ではない理由です

于 2011-06-28T05:56:58.470 に答える
2

「類似性」の適切な定義 (どの特徴を抽出し、後で何を行うか) は、ほぼクラスタリングの定義であり、クラスタリングはデータ マイニングのかなり広いサブフィールドです。

AI の標準的なシニカルな定義を、私たちがうまく解決できない問題のセット (実際、解決を開始するのに十分なほど明確に指定できない) として行う場合、データ マイニングは、ユーザーが探している空間に一度影を落とします。アルゴリズムが処理できるよりも相関が大きくなり始めるためです。

于 2010-05-22T09:20:55.980 に答える
1

類似性は、クラスタリング、分類などのいくつかのデータ マイニング タスクで使用される概念です。持っているデータの種類に応じて、テキスト ドキュメントのコサイン類似度、ユークリッド距離など、さまざまな類似度を使用できます。

于 2011-11-29T03:04:08.767 に答える