何時間も引っ張っている間にデータベースや帯域幅を殺したくないので、私は計算に少し制約があります。
私の現在のクエリは次のようなものです:
SELECT TOP (100000000) mycolumns
FROM mydb
WHERE lower_control_limit> value1
AND upper_control_limit < value2 ;
私はまともなランダムサンプルを取得していませんが、値を返す前に何十億行もトラバースしなければならないコマンドを配置することを恐れています. ドメイン (行) 全体で均一なランダム サンプルが必要です。
数十億行のサイズのストアから数億行をプルするための「ベストプラクティス」は何ですか?
私はランダムを見てきましたが、クエリのサイズと制限されたコンピューティングおよび帯域幅リソースが心配です。