4

この種のデータを分析する方法について提案が必要です。機械学習ツールとして、センチメント分析または線形回帰を実行したいと考えています。予測子はスコアです。

color   type    make    new score

red     truck   ford    y   2
black   sedan   chevy   n   4
silver  sedan   nissan  y   5
silver  truck   nissan  n   2
black   coupe   toyota  y   1
blue    van     honda   y   1
red     truck   toyota  n   4
red     coupe   ford    n   2
black   sedan   ford    y   1
blue    truck   toyota  y   4
white   coupe   chevy   y   3
white   van     toyota  n   5
red     van     ford    y   2
silver  truck   nissan  n   3
black   sedan   honda   n   1
silver  truck   chevy   y   4
red     truck   chevy   y   5
white   coupe   honda   n   5
blue    sedan   chevy   n   2
blue    van     nissan  y   3

WEKA で LinearRegression 分類子を実行すると、次の結果が得られます。

score =  1.6 ( color=red,silver,white) + 1.8 (make=honda,nissan,toyota,chevy) + 0.55

ただし、これを Web アプリ用の Django に実装したいと考えています。このデータを処理し、WEKA を使用しない線形回帰方程式を生成する別の方法はありますか。線形回帰以外の分析方法に関する他の提案はありますか? 私はすでに決定木を実装しています。

4

1 に答える 1

4

機械学習ライブラリとしてscikit-learnを使用でき、特にその線形回帰機能を使用できます。この例も役に立つかもしれません。

また、いつでも Weka Java API をアプリケーションにバインドしたり、代わりに線形回帰を独自に実装したりできます。行列代数ライブラリを指定して実装するのはかなり簡単なアルゴリズムです。

于 2012-12-19T16:44:43.310 に答える