11

年齢、都市、子供の年齢などの情報と結果(確認、承認)を含むデータセットがあります。

「ワークフロー」のモデル化を支援するために、以前のデータセットに基づいて決定木を自動的に作成したいと思います。

私はhttp://en.wikipedia.org/wiki/Decision_tree_learningを調べましたが、問題が明らかに明らかではないことを知っています。

サンプルに基づいた決定木の構築に役立つ、このテーマに関するいくつかのアルゴリズムまたはいくつかのライブラリについてアドバイスが必要です。

4

2 に答える 2

14

無料のJavaベースの教師あり学習スイートであるWekaをご覧ください。

データをWekaの単純なテキストベースの.arff形式に変換した後、GUIまたはコマンドラインインターフェイスを使用して、そのデータで次のようなさまざまな分類子をトレーニングおよびテストできるようになります。

  • 決定木
  • ニューラルネットワーク
  • ルールベースのシステム
  • サポートベクターマシン(SVM)
  • さまざまなタイプの回帰

このインターフェースを試してみると、さまざまな分類器とトレーニングパラメーターを簡単に試して、データに対して最も効果的な分類器を決定できます。

APIを使用して、Wekaを独自のソースコードに統合することもできます。

于 2009-10-13T12:36:39.403 に答える
2

Wekaのさまざまなタイプの決定木のパフォーマンスを比較する場合は、TunedIT.orgで収集されたベンチマーク結果を参照してください。

http://tunedit.org/results?d=UCI&a=Weka*tree

ドロップダウンリストとアルゴリズム/データセットの名前パターンを試して、表示する結果を選択します。

于 2010-05-17T14:21:04.647 に答える