2

何時間も引っ張っている間にデータベースや帯域幅を殺したくないので、私は計算に少し制約があります。

私の現在のクエリは次のようなものです:

SELECT TOP (100000000) mycolumns
FROM mydb
WHERE lower_control_limit> value1
    AND upper_control_limit < value2 ;

私はまともなランダムサンプルを取得していませんが、値を返す前に何十億行もトラバースしなければならないコマンドを配置することを恐れています. ドメイン (行) 全体で均一なランダム サンプルが必要です。

数十億行のサイズのストアから数億行をプルするための「ベストプラクティス」は何ですか?

私はランダムを見てきましたが、クエリのサイズと制限されたコンピューティングおよび帯域幅リソースが心配です。

4

1 に答える 1

0

これを見つけました:SQL Serverテーブルからn個のランダムな行を選択してください

 SELECT TOP (100000000) mycolumns
 FROM mydb order by newid()
于 2015-10-08T18:48:41.357 に答える