r - mclapply を使用すると、各シングルコアが並列化されていないバージョンよりも遅くなる

Question

私は R での並列計算について学んでおり、実験でこれが起こっていることを発見しました。

簡単に言うと、次の例で、「user」のほとんどの値がの値tよりも小さいのはなぜmc_tですか? 私のマシンには 32GB のメモリ、合計 4 つのコアと 8 つのハイパースレッドを備えた 2 つの CPU があります。

system.time({t = lapply(1:4,function(i) {
    m = matrix(1:10^6,ncol=100)
    t = system.time({
        m%*%t(m)
    })
    return(t)
})})


library(multicore)
system.time({
    mc_t = mclapply(1:4,function(m){
        m = matrix(1:10^6,ncol=100)
        t = system.time({
            m%*%t(m)
        })
        return(t)
    },mc.cores=4)
})

> t
[[1]]
user  system elapsed
11.136   0.548  11.703

[[2]]
user  system elapsed
11.533   0.548  12.098

[[3]]
user  system elapsed
11.665   0.432  12.115

[[4]]
user  system elapsed
11.580   0.512  12.115

> mc_t
[[1]]
user  system elapsed
16.677   0.496  17.199

[[2]]
user  system elapsed
16.741   0.428  17.198

[[3]]
user  system elapsed
16.653   0.520  17.198

[[4]]
user  system elapsed
11.056   0.444  11.520

そしてsessionInfo()：

> sessionInfo()
R version 3.0.2 (2013-09-25)
Platform: x86_64-pc-linux-gnu (64-bit)

locale:
[1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C
[3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8
[5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8
[7] LC_PAPER=en_US.UTF-8       LC_NAME=C
[9] LC_ADDRESS=C               LC_TELEPHONE=C
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C

attached base packages:
    [1] stats     graphics  grDevices utils     datasets  methods   base

other attached packages:
    [1] multicore_0.1-7

明確にするために：私の説明があいまいかもしれません。ミッション全体としてはパラレルの方が早いのは理解しています。ただし、タイムカウンターは計算用の関数にあるだけで、各子プロセスのセットアップオーバーヘッドの時間はmclapply考慮されていません。だから、なぜこの純粋な計算（つまり、m%*%t(m)）のステップが遅いのか、まだ混乱しています。

r - mclapply を使用すると、各シングル コアが並列化されていないバージョンよりも遅くなる

2 に答える 2

Related

Reference

r - mclapply を使用すると、各シングルコアが並列化されていないバージョンよりも遅くなる