Hadoop で行列ベクトル乗算を実行したいと考えています。私は今、小さな実用的な例を持っています.行列の行を含む入力ファイルは1つだけで、その後に常に乗算されるベクトルが続きます. したがって、各 map-task は、この 1 つのファイルから 1 つの行とベクトルを取得します。
ここで、2 つの入力ファイルが必要です。1 つのファイルには行列が含まれ、もう 1 つのファイルにはベクトルが含まれている必要があります。しかし、マッパーが両方のファイルにアクセスできるようにするHadoopの方法は考えられません。
ここで最善のアプローチは何でしょうか?
ご協力いただきありがとうございます!