scala - アクターを使用して共有依存関係を持つ for ループを書き直すにはどうすればよいですか

Question

より高速に実行する必要があるコードがいくつかあります。すでにプロファイリングされているため、複数のスレッドを利用したいと考えています。通常、メモリ内キューをセットアップし、キューのジョブを取得して結果を計算する多数のスレッドを用意します。共有データには、ConcurrentHashMap などを使用します。

あの道は二度と行きたくない。私が読んだことから、アクターを使用するとコードがきれいになり、akka を使用すると複数の jvm への移行がより簡単になるはずです。本当？

ただ、役者の考え方がわからないので、どこから手をつけていいのかわかりません。

問題をよりよく理解するために、いくつかのサンプルコードを示します。

case class Trade(price:Double, volume:Int, stock:String) {
  def value(priceCalculator:PriceCalculator) =
    (priceCalculator.priceFor(stock)-> price)*volume
}
class PriceCalculator {
  def priceFor(stock:String) = {
    Thread.sleep(20)//a slow operation which can be cached
    50.0
  }
}
object ValueTrades {

  def valueAll(trades:List[Trade],
      priceCalculator:PriceCalculator):List[(Trade,Double)] = {
    trades.map { trade => (trade,trade.value(priceCalculator)) }
  }

  def main(args:Array[String]) {
    val trades = List(
      Trade(30.5, 10, "Foo"),
      Trade(30.5, 20, "Foo")
      //usually much longer
    )
    val priceCalculator = new PriceCalculator
    val values = valueAll(trades, priceCalculator)
  }

}

アクターを使用した経験のある人が、これがアクターにどのようにマッピングされるかを提案していただければ幸いです。

score 3 · Accepted Answer

これは、高価な計算の共有結果に関する私のコメントを補足するものです。ここにあります：

import scala.actors._
import Actor._
import Futures._

case class PriceFor(stock: String) // Ask for result

// The following could be an "object" as well, if it's supposed to be singleton
class PriceCalculator extends Actor {
  val map = new scala.collection.mutable.HashMap[String, Future[Double]]()
  def act = loop {
    react {
      case PriceFor(stock) => reply(map getOrElseUpdate (stock, future {
        Thread.sleep(2000) // a slow operation
        50.0
      }))
    }
  }
}

使用例を次に示します。

scala> val pc = new PriceCalculator; pc.start
pc: PriceCalculator = PriceCalculator@141fe06

scala> class Test(stock: String) extends Actor {
     |   def act = {
     |     println(System.currentTimeMillis().toString+": Asking for stock "+stock)
     |     val f = (pc !? PriceFor(stock)).asInstanceOf[Future[Double]]
     |     println(System.currentTimeMillis().toString+": Got the future back")
     |     val res = f.apply() // this blocks until the result is ready
     |     println(System.currentTimeMillis().toString+": Value: "+res)
     |   }
     | }
defined class Test

scala> List("abc", "def", "abc").map(new Test(_)).map(_.start)
1269310737461: Asking for stock abc
res37: List[scala.actors.Actor] = List(Test@6d888e, Test@1203c7f, Test@163d118)
1269310737461: Asking for stock abc
1269310737461: Asking for stock def
1269310737464: Got the future back

scala> 1269310737462: Got the future back
1269310737465: Got the future back
1269310739462: Value: 50.0
1269310739462: Value: 50.0
1269310739465: Value: 50.0


scala> new Test("abc").start // Should return instantly
1269310755364: Asking for stock abc
res38: scala.actors.Actor = Test@15b5b68
1269310755365: Got the future back

scala> 1269310755367: Value: 50.0

score 2 · Accepted Answer

単純な並列化では、大量の作業を処理に投入し、すべてが戻ってくるのを待ちます。私は Futures パターンを使用する傾向があります。

class ActorExample {
  import actors._
  import Actor._
  class Worker(val id: Int) extends Actor {
    def busywork(i0: Int, i1: Int) = {
      var sum,i = i0
      while (i < i1) {
        i += 1
        sum += 42*i
      }
      sum
    }
    def act() { loop { react {
      case (i0:Int,i1:Int) => sender ! busywork(i0,i1)
      case None => exit()
    }}}
  }

  val workforce = (1 to 4).map(i => new Worker(i)).toList

  def parallelFourSums = {
    workforce.foreach(_.start())
    val futures = workforce.map(w => w !! ((w.id,1000000000)) );
    val computed = futures.map(f => f() match {
      case i:Int => i
      case _ => throw new IllegalArgumentException("I wanted an int!")
    })
    workforce.foreach(_ ! None)
    computed
  }

  def serialFourSums = {
    val solo = workforce.head
    workforce.map(w => solo.busywork(w.id,1000000000))
  }

  def timed(f: => List[Int]) = {
    val t0 = System.nanoTime
    val result = f
    val t1 = System.nanoTime
    (result, t1-t0)
  }

  def go {
    val serial = timed( serialFourSums )
    val parallel = timed( parallelFourSums )
    println("Serial result:  " + serial._1)
    println("Parallel result:" + parallel._1)
    printf("Serial took   %.3f seconds\n",serial._2*1e-9)
    printf("Parallel took %.3f seconds\n",parallel._2*1e-9)
  }
}

基本的には、ワーカーのコレクション (ワークロードごとに 1 つ) を作成し、すべてのデータを !! でスローするという考え方です。それはすぐに未来を返します。将来を読み取ろうとすると、送信者はワーカーが実際にデータを処理し終わるまでブロックします。

上記を書き換えて、代わりにPriceCalculator拡張し、データの戻りを調整することができます。ActorvalueAll

不変でないデータの受け渡しには注意が必要であることに注意してください。

とにかく、これを入力しているマシンで上記を実行すると、次のようになります。

scala> (new ActorExample).go
Serial result:  List(-1629056553, -1629056636, -1629056761, -1629056928)
Parallel result:List(-1629056553, -1629056636, -1629056761, -1629056928)
Serial took   1.532 seconds
Parallel took 0.443 seconds

(明らかに、私は少なくとも 4 つのコアを持っています。並列タイミングは、どのワーカーがどのプロセッサを取得し、マシンで他に何が起こっているかによって、かなり異なります。)

scala - アクターを使用して共有依存関係を持つ for ループを書き直すにはどうすればよいですか

2 に答える 2

Related

Reference