mysql - mysqlは主キーで選択します. パフォーマンス

Question

私はそのようなテーブル「tbl」を持っています: ID bigint(20) - 主キー、自動インクリメント field1 field2 field3

そのテーブルには60万行以上あります。

クエリ: SELECT * from tblORDER by ID LIMIT 600000、1 には 1.68 秒かかります
クエリ: SELECT ID、tblID LIMIT 600000 による ORDER からの field1、1 には 1.69 秒かかります
クエリ: SELECT ID from tblORDER by ID LIMIT 600000、1 にかかる時間は 0.16 秒
クエリ: SELECT * from tblWHERE ID = xxx は 0.005 秒かかります

これらのクエリは phpmyadmin でテストされています。

その結果、クエリ 3 とクエリ 4 が一緒になって、必ずデータが返されます。クエリ1は同じ仕事をしますが、はるかに遅くなります...

これは私には合いません。誰でもアドバイスをいただけますか？

PS フォーマットして申し訳ありません.. このサイトは初めてです。

新しいテスト:

Q5 : CREATE TEMPORARY TABLE tmptable AS (SELECT ID FROM tblWHERE ID LIMIT 600030, 30); SELECT * FROM tblWHERE ID IN (SELECT ID FROM tmptable); 0.38秒かかります

それがどのように可能かはまだわかりません。すべてのインデックスを再作成しました..そのテーブルで他に何ができますか? 手動で削除して補充しますか? :)

score 4 · Accepted Answer

クエリ 1 は、テーブルのプライマリキーインデックスを調べて、正しい 600,000 の ID とテーブル内の対応する場所を見つけ、次にテーブルに移動し、それらの 600k の場所からすべてをフェッチします。

クエリ 2 は、テーブルの主キーインデックスを調べ、正しい 600k ID とテーブル内の対応する場所を見つけてから、テーブルに移動し、それらの 600k 行から要求されたフィールドのサブセットをフェッチします。

クエリ 3 は、テーブルの主キーインデックスを調べて、正しい 600k ID を見つけ、それらを返します。表を見る必要はまったくありません。

クエリ 4 は、テーブルの主キーインデックスを調べ、要求された単一のエントリを見つけ、テーブルに移動し、その単一のエントリを読み取り、それを返します。

時間的に、逆方向に構築しましょう。

(Q4) テーブルインデックスを使用すると、O(log n) 時間でキー (id) を検索できます。つまり、テーブルのサイズが 2 倍になるたびに、インデックス内のキーを見つけるために 1 つの追加ステップしか必要としません*。100 万行ある場合、それを見つけるのに 20 ステップしかかかりません。10億行？30歩。インデックスエントリには、その行のデータを見つけるためにテーブル内のどこに移動するかに関するデータが含まれているため、MySQL はテーブル内のその場所にジャンプして行を読み取ります。これについて報告された時間は、ほぼ完全にオーバーヘッドです。

(Q3) 前述のとおり、テーブルインデックスは非常に高速です。このクエリは最初のエントリを見つけ、要求された行数になるまでツリーをトラバースします。必要なステップ数を正確に計算できると確信していますが、最大で 20 ステップ x 600k 行 = 12M ステップとします。ツリーをトラバースしているので、1M ステップのようになる可能性がありますが、正確な数はほとんど関係ありません。ここで認識すべき最も重要なことは、MySQL がインデックスを調べて必要な ID を取得すると、必要なものがすべて含まれているということです。テーブルを見に行く必要はありません。これについて報告された時間は、基本的に、MySQL がインデックスを移動するのにかかる時間です。

(Q2) これは、クエリ 3 で説明したのと同じツリーウォークから始まりますが、必要な ID を取得するときに、MySQL はテーブルファイル内のそれらの場所も取得します。次に、テーブルファイル (おそらく既にmmapメモリにキャッシュ/ペディングされている) に移動し、プルされたすべてのエントリに対して、テーブル内の適切な場所を探し、それらの行から要求されたフィールドを取得する必要があります。このクエリで報告された時間は、インデックスを移動するのにかかる時間 (第 3 四半期と同様) に、インデックスで指定されたすべての行にアクセスするのにかかる時間を加えたものです。

(Q1) すべてのフィールドが指定されている場合、これは Q2 と同じです。時間は基本的に第 2 四半期と同じであるため、インデックスをクロールして行をシークすることによって小さくなった場合はいつでも、データベースからより多くのフィールドを取得するのにそれほど時間がかからないことがわかります。

*: ほとんどのデータベースは、対数ベースが 2 よりはるかに大きいインデックスデータ構造 ( MySQLの場合は B ツリー) を使用します。数百倍から数千倍になります。これは、例で述べた 20 ～ 30 ステップではなく、2 ～ 5 ステップに近いことを意味します。

mysql - mysqlは主キーで選択します. パフォーマンス

1 に答える 1

Related

Reference