1

私は現在、マハウトをいじろうとしています。Mahout in Actionという本を購入しました。プロセス全体が理解されており、単純なテスト データ セットですでに成功しています。

今、私は解決したい分類問題を抱えています。

ターゲット変数が見つかりました。これを - 今のところ - x と呼びます。データベース内の既存のデータは、すでに -1、0、および +1 で分類されています。

SQL クエリで選択するいくつかの予測変数を定義しました。

これらは製品の属性です: 言語、国、カテゴリ (ショップの)、タイトル、説明。

今度は、それらを SequenceFile に直接書き込む必要があります。そのために、SQL 結果セットの新しい行が処理されるたびにシーケンス ファイルに追加する小さなヘルパー クラスを作成しました。

public void appendToFile(String classification, String databaseID, String language, String country, String vertical, String title, String description) {
    int count = 0;
    Text key = new Text();
    Text value = new Text();

    key.set("/" + classification + "/" + databaseID);
    //??value.set(message);
    try {
        this.writer.append(key, value);
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
}

タイトルなどしかない場合は、値に単純に格納できますが、その特定のキーに国、言語などの複数の値を格納するにはどうすればよいでしょうか?

助けてくれてありがとう!

4

1 に答える 1