database - データベースの耐久性とパフォーマンス

Question

私はデータベースで耐久性がどのように達成されるかをたくさん研究しました、そして私がよく理解すればそれはこのように機能します（単純化された）：

クレントの視点：

トランザクションを開始します。
テーブル値に挿入...
トランザクションのコミット

DBエンジンの観点：

トランザクション開始インジケーターをログファイルに書き込みます
クライアントによって行われた変更をログファイルに書き込みます
トランザクションコミットインジケーターをログファイルに書き込みます
ログファイルをHDDにフラッシュします（これにより、データの耐久性が保証されます）
クライアントに「OK」を返します

私が観察したこと：

クライアントアプリケーションはシングルスレッドアプリケーション（1つのデータベース接続）です。私は400トランザクション/秒を実行できますが、ファイルに何かを書き込んでからこのファイルをHDDにfsyncする簡単なテストでは、150同期/秒しか実行されません。クライアントがマルチスレッド/マルチ接続の場合、DBエンジンがトランザクションをグループ化し、いくつかのトランザクションごとに1つのfsyncを実行すると想像しますが、そうではありません。

私の質問は、たとえばMsSQLが、トランザクションのコミットごとにログファイル（fsync、FlushFileBuffersなど）を実際に同期するのか、それとも他の種類の魔法の背後にあるのかということです。

score 0 · Accepted Answer

簡単に言えば、トランザクションが永続的であるためには、データベースへの変更がディスクに書き込まれる前に、ログファイルが安定したストレージに書き込まれる必要があります。

安定したストレージは、想像以上に複雑です。たとえば、ディスクは通常、安定したストレージとは見なされません。(とにかく、トランザクションデータベースエンジンのコードを書く人によるものではありません。)

特定のオープンソース dbms が安定したストレージにどのように書き込むかを確認するには、ソースコードを読む必要があります。PostgreSQL のソースコードはオンラインです。(ファイルは xlog.c です) MySQL のソースがわかりません。

database - データベースの耐久性とパフォーマンス

1 に答える 1

Related

Reference