mongoDB の大規模なコレクションを操作する場合、ドキュメントのセット全体ではなくサンプルの分析を行うと役立つことがよくあります。これを行う明確な方法の 1 つは、ObjectId を整数にマッピングするハッシュ関数を介して実行し、$mod を使用してドキュメントのサブサンプルを選択することです。
重要なポイントは、効果的にランダムな方法でドキュメントのサンプルを抽出することです。セットへの選択は、私たちが気にする可能性のある他のものと相関していません。
これを行う良い方法はありますか?クエリが高速な場合のボーナス ポイント。
PS:ランダム属性のアプローチは知っていますが、ストレージ スペースを浪費するのであまり好きではありません。