3

「n 対 m」の関係を持つ数値データセット (データベース テーブルとして) があります。例えば:

A | B
-----
1 | 1
1 | 2
1 | 9
4 | 2
7 | 8
7 | 11

そして、B のセットに対してどの A が最も可能性が高いかを教えてくれるように、(weka を使用して) 分類器を「トレーニング」したいと思います。例: [1,2,8] は、{1:2, 4:1, 7:1} の行に沿って何かを教えてくれるはずです。つまり、「セットは AN 回に見つかりました」

もちろん、SQL とお気に入りのスクリプト言語でこれを実装できます。ただし、もっと「正式な」方法だと思いますが、それを行う方法があるかどうかを知りたかったのです。私はwekaを実行しており、データベースに接続していますが、どの分類子を使用するかがわかりません(多くの場合、サービスを拒否します)。また、理論的な背景に関するいくつかのリンクも大歓迎です(たとえば、私がやりたいことと呼ばれるものとは何ですか?どのような改善が存在するか)。

あなたがRでより多才であれば、「R」の方法もありがたいです.(しかし、私は自分の問題を解決するだけでなく、これがどのような種類の問題であるかを理解することに興味があります.wekaソリューションを介して.)申し訳ありませんこれが何らかの形で重複した質問である場合、悲しいことに、ここで探しているものを特定するための情報が不足しています。学び勉強するための視覚化やその他のアウトプットは素晴らしいでしょう。

お読みいただき、お役に立てれば幸いです。

4

1 に答える 1

1

R では、次のように実行できます。

foo = data.frame(A=c(1,1,1,4,7,7),B=c(1,2,9,2,8,11))
foo
#   A  B
# 1 1  1
# 2 1  2
# 3 1  9
# 4 4  2
# 5 7  8
# 6 7 11

table(foo[foo$B %in% c(1,2,8),]$A)

# 1 4 7 
# 2 1 1 

もっと何か必要ですか?

于 2012-11-18T23:05:04.440 に答える