私は現在、マハウトをいじろうとしています。Mahout in Actionという本を購入しました。プロセス全体が理解されており、単純なテスト データ セットですでに成功しています。
今、私は解決したい分類問題を抱えています。
ターゲット変数が見つかりました。これを - 今のところ - x と呼びます。データベース内の既存のデータは、すでに -1、0、および +1 で分類されています。
SQL クエリで選択するいくつかの予測変数を定義しました。
これらは製品の属性です: 言語、国、カテゴリ (ショップの)、タイトル、説明。
今度は、それらを SequenceFile に直接書き込む必要があります。そのために、SQL 結果セットの新しい行が処理されるたびにシーケンス ファイルに追加する小さなヘルパー クラスを作成しました。
public void appendToFile(String classification, String databaseID, String language, String country, String vertical, String title, String description) {
int count = 0;
Text key = new Text();
Text value = new Text();
key.set("/" + classification + "/" + databaseID);
//??value.set(message);
try {
this.writer.append(key, value);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
タイトルなどしかない場合は、値に単純に格納できますが、その特定のキーに国、言語などの複数の値を格納するにはどうすればよいでしょうか?
助けてくれてありがとう!