Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
ID3/C4.5に決定木を実装したいHadoop。誰もが先に進む方法を考えることはできますか.
ID3/C4.5
Hadoop
アルゴリズムについては明確ですが、それらを並列化する方法を知る必要があります。
属性選択の 1 回の反復を 1 つの MapReduce ジョブとして行うアプローチを検討します。この考え方に従って、属性の各マッパーに割り当てて情報の取得を確認し、reduce フェーズ (単一の reducer を使用) で最適な属性を選択できます。 1 台のマシンでの 1 回の反復の計算 (すべての属性) が、ジョブ開始のオーバーヘッド (約 20 ~ 40 秒) よりも多少長い場合、このアプローチは実用的であると考えます。