この種のデータを分析する方法について提案が必要です。機械学習ツールとして、センチメント分析または線形回帰を実行したいと考えています。予測子はスコアです。
color type make new score
red truck ford y 2
black sedan chevy n 4
silver sedan nissan y 5
silver truck nissan n 2
black coupe toyota y 1
blue van honda y 1
red truck toyota n 4
red coupe ford n 2
black sedan ford y 1
blue truck toyota y 4
white coupe chevy y 3
white van toyota n 5
red van ford y 2
silver truck nissan n 3
black sedan honda n 1
silver truck chevy y 4
red truck chevy y 5
white coupe honda n 5
blue sedan chevy n 2
blue van nissan y 3
WEKA で LinearRegression 分類子を実行すると、次の結果が得られます。
score = 1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55
ただし、これを Web アプリ用の Django に実装したいと考えています。このデータを処理し、WEKA を使用しない線形回帰方程式を生成する別の方法はありますか。線形回帰以外の分析方法に関する他の提案はありますか? 私はすでに決定木を実装しています。