mysql - 全体的なパフォーマンスに影響を与えないように、Mysql テーブルのインデックス作成を調整する方法はありますか?

Question

大規模なデータセットを本番データベースにロードする必要があります。

15 個のファイルをそれぞれアップロードしてテーブルに挿入する必要があります。それぞれ約500 Mbです。

インデックスを作成する必要がある 2 つの ID 列があります。インデックスを配置してファイルをロードすると、アップロードに約 3 時間かかります。インデックスを削除し、ローカルファイルにデータをロードしてから、インデックスを再度追加すると、操作全体に約 30 分かかります。

問題は、新しくインポートされたデータのインデックス作成中に、データベースの応答性が大幅に低下することです。インデックス作成を「低い優先度」で実行して、他のクエリが 95 ～ 100% の速度で実行され、インデックス作成の種類がバックグラウンドで動作するようにする方法はありますか?

Amazon RDSを使用しているため、別のサーバーにロードしてからテーブルファイルをコピーするというオプションはありません。

特定のボックスのインデックス作成中に優れたパフォーマンスを得る方法があるかどうかを確認したいので、これに報奨金を追加します。

score 4 · Accepted Answer

スロットルする方法は見つかりませんでしたが、問題を軽減する方法を見つけました。解決策は私の問題に固有のものでしたが、他の誰かが役に立つと思った場合に備えて投稿します。

という名前のクラスを書きましたCautiousIndexer。

まず、create table ステートメントを格納して、インデックスなしでテーブル構造を再作成しました。読み取りスレーブデータベースの配列を格納し、それらをループ処理して、インデックスのないデータを含むテーブルの名前をに変更しましたprevent_indexing_($name)。
次に、スレーブのみで create table ステートメントを実行しました。これにより、マスターで発生するインデックス作成ステートメントの邪魔にならないようにデータが効果的に移動されました。
次に、マスターに対してインデックスクエリを実行しました。新しく作成されたテーブルが空だったため、マスターがインデックスを作成している間、読み取りスレーブはパフォーマンスに影響を与えませんでした。
マスターがインデックス作成を終了したとき、私はスレーブの 1 つを生産ローテーションから取り出し、空のテーブルを削除し、テーブル全体を元の場所に移動してから、生産を停止したスレーブのテーブルにインデックスを作成しました。
それが終わったら、本番環境に戻し、残りのスレーブでスレーブのインデックス作成手順を繰り返しました。
すべてのスレーブのインデックスが作成されたら、テーブルを本番環境に置きました。

これでも効率は問題ありませんでしたが、マスターサーバーでのインデックス作成中は書き込みパフォーマンスが許容できないほど遅くなりました。スロットルを使用してインデックスを作成する方法をまだ探しています。

score 1 · Accepted Answer

これはあなたが探している正確な解決策ではありませんが、この単一のボックスのスレーブとして2番目のmysqldインスタンスを起動SELECTし、必要に応じてクエリをリダイレクトすることができます。クライアントアプリを書き直さずにこれを実現するのに役立つMySQLプロキシがあります。

You can also gather some ideas from FriendFeed usage of MySQL. They store actual indexes in other tables and use them for search. If you store a copy of you data in other table even on other server and run indexes there, you'll be able to access master data ASAP at full speed and get speedier queries later using other server.

It's like if you add indexes on a slave for search-type queries and run only primary key lookups on the master.

score 1 · Accepted Answer

これに対する適切な解決策は、ローリング更新を実行するスクリプトです。レプリケートしない方法で各スレーブにインデックスを適用します。大まかな図:

for host in $hosts
do
    mysql -h $host -e "STOP SLAVE;\
      SET sql_log_bin=0;\
      FLUSH TABLE t;\
      ALTER TABLE t ADD INDEX a (b,c);\
      SET sql_log_bin=1;\
      START SLAVE;"
done

レプリケーションをオフにすると、ディスクアクティビティの量が減少し、インデックス作成操作の速度が向上します。スレーブにデータベースラグの要件がある場合は、スレーブを完全にデプールし、0 秒のラグが再開したときにスレーブを再プールするロジックを含めることができます。

score 0 · Accepted Answer

インポートのインデックス設定を上げてみましたか? これにより、インポートのパフォーマンスが大幅に向上します。sort_buffer_size は任意のテーブルタイプ用で、myisam_sort_buffer_size は MyISAM テーブル用です。innodb_buffer_pool_size は、Innodb の「キーキャッシュ」のようなものです。テーブルの種類に応じて、インポートのためにそれらを増やします。あなたがしようとしているのは、インデックス作成中のファイルの並べ替えを避けることです。

インポート/インデックス作成の時間を 10 ～ 15 分以下に短縮できる場合があります。スロットルではありませんが、影響期間が大幅に短縮されます。

または、MyISAM テーブルを使用している場合、MERGE テーブルはオプションでしょうか? 新しいテーブルを作成し、インポートを実行してから、新しいテーブルを MERGE テーブルに追加します。インポート中のデータベースへの影響はありません。タスクを実行するサーバーは別として。

score 0 · Accepted Answer

以前に試したことのないアイデアは、インデックスの調整についてもありません。バックアップテーブルを作成し、前述の方法でそれを更新すると、テーブルの変換/名前変更よりも期間が短くなります。方法を知る必要があるため、私の考えを書くことをお勧めします。

score 0 · Accepted Answer

挿入中に一意でないインデックスを無効にし、終了後に再度有効にすることができます。キーの無効化/キーの有効化をご覧ください。ただし、一意でないインデックスに対してのみ機能します。

複数値の挿入ステートメントを使用すると、挿入を高速化することもできます (insert into table(...) values(...),(...),(...)...

ちなみに、ロードデータインファイルは、mysqlに大量のデータを挿入する最速の方法のようです。

mysql - 全体的なパフォーマンスに影響を与えないように、Mysql テーブルのインデックス作成を調整する方法はありますか?

6 に答える 6

Related

Reference