0

私は Apache Mahout を初めて使用し、分類の問題に取り組んでいます。

問題の状態: テキスト ファイルに一連のデータが存在し、指定された期間に応じてファイルから一部またはすべてのデータを取得する必要があります。

期間 : 各レコードにはトランザクションの日付があります。
したがって、期間はロジック (Sys_Date - Transaction_Date) を使用して計算されます。

したがって、先月/週/特定の日数のデータが必要かどうかによって、出力は異なります。
このフィルタリングは、Apache Mahout を使用してどのように実現できますか。

4

2 に答える 2

1

これ自体は、機械学習の問題とは思えません。データをある種のデータベースに入れ、日付範囲内のレコードを照会したいとします。次に、そのデータを使って何かをしたいとします。これは、ML ツールが行うことではありません。

于 2012-12-12T08:47:13.020 に答える
0

私はまだ Hadoop を適切に扱っていません。しかし、このビデオが役立つように思えます: http://www.youtube.com/watch?v=KwW7bQRykHI&feature=player_embedded

フィルタリング後、結果を mahout で使用できます (分類問題を解決するため)。

于 2012-12-17T13:39:27.517 に答える