Haskellは遅延評価を使用して再帰を実装するため、必要なときに値を提供するという約束として何でも扱います(これはサンクと呼ばれます)。サンクは、続行するために必要なだけ減少し、それ以上は減少しません。これは、数式を数学的に単純化する方法に似ているため、そのように考えると役立ちます。評価順序がコードで指定されていないという事実により、コンパイラーは、以前の末尾呼び出しの除去よりもさらに巧妙な最適化を行うことができます。最適化が必要な場合は、コンパイルしてください。-O2
facSlow 5
ケーススタディとしてどのように評価するか見てみましょう。
facSlow 5
5 * facSlow 4 -- Note that the `5-1` only got evaluated to 4
5 * (4 * facSlow 3) -- because it has to be checked against 1 to see
5 * (4 * (3 * facSlow 2)) -- which definition of `facSlow` to apply.
5 * (4 * (3 * (2 * facSlow 1)))
5 * (4 * (3 * (2 * 1)))
5 * (4 * (3 * 2))
5 * (4 * 6)
5 * 24
120
心配しているように、計算が行われる前に数値が蓄積されますが、心配しているのとは異なりfacSlow
、終了を待つ関数呼び出しのスタックはありません-各削減が適用されて消え、スタックフレームが残りますwake(これは、(*)
が厳密であり、2番目の引数の評価をトリガーするためです)。
Haskellの再帰関数は、あまり再帰的に評価されません。ぶら下がっている呼び出しの唯一のスタックは、乗算自体です。(*)
厳密なデータコンストラクターと見なされる場合 、これはガードされた再帰として知られています(ただし、通常は非厳密なデータコンストラクターと呼ばれ、その後のアクセスによって強制された場合にデータコンストラクターが残ります)。
次に、末尾再帰を見てみましょうfac 5
。
fac 5
fac' 5 1
fac' 4 {5*1} -- Note that the `5-1` only got evaluated to 4
fac' 3 {4*{5*1}} -- because it has to be checked against 1 to see
fac' 2 {3*{4*{5*1}}} -- which definition of `fac'` to apply.
fac' 1 {2*{3*{4*{5*1}}}}
{2*{3*{4*{5*1}}}} -- the thunk "{...}"
(2*{3*{4*{5*1}}}) -- is retraced
(2*(3*{4*{5*1}})) -- to create
(2*(3*(4*{5*1}))) -- the computation
(2*(3*(4*(5*1)))) -- on the stack
(2*(3*(4*5)))
(2*(3*20))
(2*60)
120
したがって、末尾再帰だけでは時間やスペースを節約できなかったことがわかります。全体としてより多くのステップを実行するだけでなくfacSlow 5
、ネストされたサンク(ここではとして表示)を構築します-追加のスペース{...}
が必要です-将来の計算、実行されるネストされた乗算を記述します。
次に、このサンクは、スタック上で計算を再作成して、最下部までトラバースすることによって解明されます。どちらのバージョンでも、非常に長い計算でスタックオーバーフローが発生する危険性もあります。
これを手作業で最適化したい場合は、厳密にするだけです。厳密なアプリケーション演算子$!
を使用して定義できます
facSlim :: (Integral a) => a -> a
facSlim x = facS' x 1 where
facS' 1 y = y
facS' x y = facS' (x-1) $! (x*y)
これfacS'
により、2番目の引数が厳密になります。(最初の引数は、どの定義facS'
を適用するかを決定するために評価する必要があるため、すでに厳密です。)
厳密さが非常に役立つ場合もあれば、怠惰の方が効率的であるため、大きな間違いである場合もあります。ここにそれは良い考えです:
facSlim 5
facS' 5 1
facS' 4 5
facS' 3 20
facS' 2 60
facS' 1 120
120
それがあなたが達成したかったことだと思います。
概要
- コードを最適化する場合、ステップ1は次のコマンドでコンパイルすることです。
-O2
- 末尾再帰は、サンクの蓄積がない場合にのみ有効であり、必要に応じて、厳密さを追加すると、通常、それを防ぐのに役立ちます。これは、後で必要になる結果を一度に作成するときに発生します。
- 末尾再帰は不適切な計画であり、ガード再帰の方が適している場合があります。つまり、構築している結果が少しずつ必要になる場合です。たとえば、についてのこの質問を参照して、それらを相互にテストしてください。
foldr
foldl
次の2つを試してください。
length $ foldl1 (++) $ replicate 1000
"The size of intermediate expressions is more important than tail recursion."
length $ foldr1 (++) $ replicate 1000
"The number of reductions performed is more important than tail recursion!!!"
foldl1
は末尾再帰ですが、foldr1
ガードされた再帰を実行するため、最初のアイテムはすぐに提示され、さらに処理/アクセスできます。(最初の括弧は一度に左に「括弧で囲まれ」(...((s+s)+s)+...)+s
、入力リストを完全に最後まで強制し、完全な結果が必要になるよりもはるかに早く将来の計算の大きなサンクを構築します。2番目の括弧は徐々に右に括弧s+(s+(...+(s+s)...))
で囲み、入力を消費します。少しずつリストするので、すべてが最適化されて一定の空間で動作することができます)。
使用しているハードウェアによっては、ゼロの数を調整する必要がある場合があります。