c# - 巨大なデータベースからIDを選択する

Question

3,000,000行を超えるデータベースがあり、それぞれにvarchar（6000）を含むidフィールドとxmlフィールドがあります。

私がそうするならば、SELECT id FROM bigtableそれは完了するのに+-2分かかります。30秒でこれを取得する方法はありますか？

score 3 · Accepted Answer

id 列にクラスター化インデックスを構築する

score 2 · Accepted Answer

テーブルにインデックスを適用できます。あなたの場合、クラスター化インデックス。

クラスタ化インデックス:

また、クエリをフィルタリングして、毎回 300 万行すべてが返されないようにすることもお勧めします。これは、TOPまたはを使用して行うことができますWHERE。

上：

SELECT TOP 1000 ID
FROM bigtable

どこ：

SELECT ID FROM
bigtable
WHERE id IN (1,2,3,4,5)

score 0 · Accepted Answer

まず第一に、300万のレコードはテーブルを「巨大」にしません。

クエリを最適化するには、次のことを行う必要があります。

クエリをフィルタリングします。なぜすべてのIDを取得する必要があるのですか？

ID列のクラスター化インデックスを作成して、選択した行を指す前に最初に検索する小さなルックアップテーブルを取得します。

こことここに役立つスレッド

score 0 · Accepted Answer

パフォーマンスを向上させるために、テーブルにインデックスを付けることができます。

パーティション機能のようなパフォーマンスを向上させるために使用できる追加オプションもあります。

score 0 · Accepted Answer

さて、なぜすべてのIds をクライアントに戻すのですか?

テーブルにクラスター化されたインデックスがない場合でも (これは疑問です)、処理時間の大部分はクライアント側で発生Idし、ネットワーク経由で値を転送して画面に表示します。

すべての値に対してクエリを実行すると、クエリエンジンを使用するメリットが失われます。

すべての s を取得するために私が考えることができる (おそらく想像力に欠ける) 唯一の理由Idは、ある種の誤ったキャッシングです。

多くのことを知りたい場合は、

SELECT count(*) FROM [bigtable]

Idが存在するかどうかを知りたい場合は、

SELECT count([Id[) FROM [bigtable] WHERE [Id] = 1 /* or some other Id */

これは、指定されたの存在を示す 1 または 0 を持つ 1 行を返しますId。

これらのクエリはどちらも、クラスター化されたインデックスの恩恵を大きく受け、Id最小限のデータと最大限の情報を返します。

これらのクエリはどちらも 30 秒未満で返され、クラスター化インデックスがオンになっている場合は 30 ミリ秒未満で返されます。Id

すべてのを選択してIdも、これらのクエリ以上の有用な情報は得られず、得られるのはネットワークとクライアントのトレーニングだけです。

5 に答える 5