Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
HDFSでシリアル化された数百万のノードを持つ決定木があります。マップリデュースを使用してHadoopでより効率的に検索を実行できるように、シリアライゼーションを改善する方法を教えてください。
ありがとう。
ツリーをトラバースするには、モデルをメモリにロードする必要があります。ロードされると、インスタンスのトラバースを実行するのは非常に簡単かつ高速です。モデルを hdfs に格納することは避けられないため、より良いトラバースを実行するには、メイン メモリでより良い処理を行う必要があります。しかし、私が言ったように、ツリー トラバースは常に超高速です。おそらく、あなたの問題についてもう少し情報を提供するといいでしょう。あなたの問題は、何百万もの新しい例を持ち、それらのラベルを予測することですか?