2

ID3/C4.5に決定木を実装したいHadoop。誰もが先に進む方法を考えることはできますか.

アルゴリズムについては明確ですが、それらを並列化する方法を知る必要があります。

4

1 に答える 1

0

属性選択の 1 回の反復を 1 つの MapReduce ジョブとして行うアプローチを検討します。この考え方に従って、属性の各マッパーに割り当てて情報の取得を確認し、reduce フェーズ (単一の reducer を使用) で最適な属性を選択できます。
1 台のマシンでの 1 回の反復の計算 (すべての属性) が、ジョブ開始のオーバーヘッド (約 20 ~ 40 秒) よりも多少長い場合、このアプローチは実用的であると考えます。

于 2012-10-15T16:14:05.810 に答える