1

HDFSでシリアル化された数百万のノードを持つ決定木があります。マップリデュースを使用してHadoopでより効率的に検索を実行できるように、シリアライゼーションを改善する方法を教えてください。

ありがとう。

4

1 に答える 1

0

ツリーをトラバースするには、モデルをメモリにロードする必要があります。ロードされると、インスタンスのトラバースを実行するのは非常に簡単かつ高速です。モデルを hdfs に格納することは避けられないため、より良いトラバースを実行するには、メイン メモリでより良い処理を行う必要があります。しかし、私が言ったように、ツリー トラバースは常に超高速です。おそらく、あなたの問題についてもう少し情報を提供するといいでしょう。あなたの問題は、何百万もの新しい例を持ち、それらのラベルを予測することですか?

于 2011-12-30T18:50:48.280 に答える