0
  1. 知りたいのですが、データマイニングにおけるMODELとは何ですか? 誰もそれを説明できますか?

  2. Weka を使用するときは、データを取得し、メソッドを選択して、[開始] ボタンをクリックしてモデルを生成します。このモデルの背後にあるものと、生成後のモデルの仕組みを説明できる人はいますか? たとえば、選択した方法を使用して例を分類しますか?

誰かがこれらのことを説明できますか?

4

2 に答える 2

3

モデルは、新しいデータを処理しようとするときに使用される情報を単純に記述します。単純なスパム検出シナリオでは、アルゴリズムは、注釈付きの電子メールを見て、どの単語がスパムを指していて、どの単語がそうでないかを判断します。次に、単語のリストがモデルを形成します。

新しいメールを受信したとき、他の実際のメールと比較するのではなく、新しいメールの単語を考慮し、モデル (単語リスト) をチェックして、スパム メールを示しているように見えるかどうかを確認します。トレーニング データから独立していることがわかります。代わりに、「スパム対非スパム」の現実全体をモデル化しようとする知識が得られます。

于 2011-04-25T10:32:23.650 に答える
0

音楽に関連する次の変数のみがあるとします: ギターソロ (ある/ない)、突然の音色変化 (ある/ない)、ボーカル (ある/ない、男性/女性)、ドラム (ある/ある) 't、通常/電子)。

では、ギターソロ、急な音色変化、女性ボーカル、電子ドラムなどの音楽を楽しんでいるとしましょう。他方では、ギターソロがあり、突然の音色変化があり、ボーカルがなく、通常のドラムがある音楽を高く評価しています)。

それらの嗜好は、私たちが音楽を楽しむためのモデルと考えることができます。

ここで、ギターソロ、急な音色変化、女性ボーカル、電子ドラムを含む曲があるとします。あなたがこの曲を楽しんでいるかどうかを判断するなら、答えは「はい」です。それは 100% 一致しています。しかし、私はどうですか?そうですね、この曲の 5 つの特徴のうち 3 つを高く評価しているので、おそらく楽しめると思います。

曲を鑑賞するかどうかについての上記の答えは、機械学習における分類タスクと見なすことができます。ここで、上記の音楽の好みと音楽の機能に関して全員をグループ化する必要がある場合は、音楽のリスナーをクラスタリングすることになります。

何かのモデルをどのように構築しますか? もちろんデータから。Weka を使用している場合、.arff ファイルにはトレーニング データが含まれており、Weka はそれを使用して、それらのデータによって表されるものについて学習します (この例では、音楽の好みを学習します)。

学習プロセスは、新しいデータの分類、グループ化などに使用されるモデルを生成します。たとえば、Weka に音楽の好みを提供し、ベイジアン分類器を使用してモデルを学習するように指示した場合、特徴を提供するときに、与えられた曲の場合、その曲が好きかどうか、そしてどのくらいの確率で好きかを知ることができます。

于 2013-12-05T16:52:14.607 に答える