0

Weka の NaiveBayesUpdateable 分類子を使用しようとしていました。私のデータには、公称属性と数値属性の両方が含まれています。

  @relation cars
  @attribute country {FR, UK, ...}
  @attribute city {London, Paris, ...}
  @attribute car_make {Toyota, BMW, ...}
  @attribute price numeric   %% car price 
  @attribute sales numeric   %% number of cars sold

他の属性に基づいて販売数 (数値!) を予測する必要があります。

Wekaでベイズ分類に数値属性が使えないことは理解しています。1 つの手法は、数値属性の値を長さ k の N 区間に分割し、代わりに公称属性を使用することです。ここで、n はクラス名です。たとえば、@attribute class {1,2,3,...N} のようになります。

それでも、予測する必要がある数値属性は 0 から 1 000 000 の範囲です。1 000 000 クラスを作成してもまったく意味がありません。Wekaで数値属性を予測する方法、またはWekaにこのタスク用のツールがない場合に探すアルゴリズムは何ですか?

4

2 に答える 2

0

@larsmans が述べたように、これは分類ではなく回帰モデルです。問題は、回帰が数値データでのみ機能することです。カテゴリ データの標準的なアプローチは、いわゆるダミー変数を使用することです。各ダミー変数は、カテゴリ変数の 1 つの状態を表し、1 または 0 のいずれかです。したがって、属性リストは次のように変更できます。

@relation cars
@attribute country_FR
@attribute country_UK
...
@attribute city_London
@attribute city_Paris
...

たとえば、都市がロンドンの場合、変数city_Londonは 1 に設定され、他のすべてのcity_*変数は 0 に設定されます。

于 2013-04-25T23:43:04.263 に答える