garbage-collection - ガベージコレクタを 2 段階で停止してコピーする

Question

ストップアンドコピーガベージコレクターをペアとして実装する場合、2 つのメモリバンク (古いものと空きの新しいもの) が必要です。1 つのメモリバンクは、the-cars と the-cdrs で構成されます。基本的に、新しいアドレスを作成するとき、それは the-cars と the-cdrs へのポインターです。

新しいメモリを割り当てるときに十分なスペースがないことがわかった場合、GC を開始します。これが行うことは次のとおりです。

メモリーバンクを切り替える
移動: 古いバンクから car と cdr を読み取り、新しいバンクにコピーして、後で使用するために古いバンクに新しいバンクへのポインタを置きます。
scan: メモリをループして、古いものから新しいものへすべてをコピーします。

問題は、なぜ最初にスキャンしてから移動する必要があるのかということです。両方を一緒にできないのはなぜですか？

score 5 · Accepted Answer

独自のコレクター (マークとスイープ、停止とコピー、世代別) を実装する、本当に素晴らしいガベージコレクションの割り当てを行っているようです。

質問に対する一般的な回答: 通常、2 パスアルゴリズムは、スペースと時間を交換することにより、1 パスアルゴリズムよりも少ないメモリを使用します。

より具体的な答え: ストップアンドコピーコレクターでは、(1) 最初にライブデータを新しいセミスペースにコピーし、(2) ライブデータの内部参照を調整して要素を参照するという 2 つのパスでそれを行います。新しい半空間、古いメモリを新しいメモリにマッピングします。

マッピングを行うために必要な情報は、魔法のように利用できるわけではないことを認識する必要があります。移動したメモリをリダイレクトする方法を追跡するには、メモリが必要です。そして覚えておいてください: コレクター自体はプログラムであり、限定された少量のメモリを使用する必要があります! たとえば、簿記を行うためにコレクターにハッシュテーブルを保持することは禁止されています。規則に従っていないからです。したがって、追跡する必要があることの 1 つは、コレクターが限られた量のメモリでプレイしていることを確認することです。ストップアンドコピーコレクターが古いセミスペースを再利用し、そこにリダイレクトレコードを書き込む理由はこれで説明できます。

この制約を念頭に置いて、ライブセットをどのようにトラバースするかに注意する必要があることを理解することが重要です。どのアプローチを選択するかは、非常に微妙で驚くべき方法で追加のメモリを必要とする場合と必要としない場合があります。特に、一般的な場合の再帰は無料ではありません! 技術的には、最初のパスでは、コピーのターゲットとしてだけでなく、ライブデータをウォークスルーする再帰プロセスを実装するために使用するコントロールスタックのファンキーな表現として、新しい半空間を使用する必要があります。

具体的には、ライブセットをコピーするために次のようなワンパスアプローチを行う場合:

;; copy-live-set: number -> void
;; copies the live set starting from memory-location.

Pseudocode:

to copy-live-set starting at memory-location:

  copy the block at memory-location over to the new semispace, and

  record a redirection record in the old semispace

  for each internal-reference in the block:

      recursively call copy-live-set at the internal-reference if
      it hasn't been copied already

      remap the internal-reference to that new memory location

すると、メモリがめちゃくちゃになっていることに驚くかもしれません。ここでの再帰は反復的ではないため、上記はコレクターがランタイム環境に対して行っている約束を破ります! コントロールスタックスペースを消費します。ライブセットのトラバーサル中は、歩いている構造物の深さに比例してコントロールスタックスペースが消費されます。おっと。

ライブセットをウォークスルーする別の方法を試してみると、限定された小さなコントロールスタックの使用を保証しながら、ライブセット全体をトラバースする良い方法があることが最終的にわかるはずです。ヒント: グラフトラバーサルアルゴリズムを単純な while ループとして記述し、コンテナーを使い果たすまで次にアクセスするものを保持する明示的なコンテナーを使用する方法を検討してください。正しく目を細めると、新しい半空間の中間値がそのコンテナーのように見えます。

一定の制御スタックスペースでライブセットをトラバースする方法を発見すると、完全なコピーアンドリライト内部参照を実行するためにこれら 2 つのパスが必要になることがわかります。これらの詳細を気にするのは厄介ですが、ガベージコレクターが実際にどのように機能するかを確認することは重要です。実際のコレクターは、コレクション中に制限されたメモリを確実に使用するために、スタックの使用を制御するために、このようなことを行う必要があります。

要約: 2 パスアルゴリズムは、ある程度の時間を犠牲にしてメモリを使用するのに役立つソリューションです。しかし、パフォーマンスに関してはあまりお金を払っていません。ライブセットを 2 回通過しますが、プロセスはライブセットのサイズに比例します。

歴史: Cheney's Algorithmを参照し、影響力のある論文の強調のタイトルに注意してください: " A Nonrecursive List Compacting Algorithm ". この 1 つの強調表示された単語「非再帰」が、2 パスアプローチの動機の鍵です。これは、制御スタックの消費を回避しようとしています。Cheney の論文は、Fenichel と Yochelson による論文「A LISP Garbage-Collector for Virtual-Memory Computer Systems」を拡張したものであり、そこで著者は基本的に再帰的でスタックを使用するアプローチを最初に提案しました。状況を改善するために、Fenichel と Yochelson は、非再帰的 (しかし複雑な!) Schorr-Waite DFS アルゴリズムを使用することを提案しました。トラバーサルを行います。Cheney のアプローチは、トラバーサルがより単純であるため、改善されています。

garbage-collection - ガベージ コレクタを 2 段階で停止してコピーする

1 に答える 1

Related

Reference

garbage-collection - ガベージコレクタを 2 段階で停止してコピーする