だから私はmongodbデータベースを持っていて、それをランダムに分割したいと思います。
つまり、データベースのサイズは$ s $であり、分類子をトレーニングするための$ frac {s} {2} $と、テストするための$ frac {s}{2}$ができるようにデータベースを分割したいと思います。精度です。~~クロスフォールド検証。どうやってやるの?すべてのエントリに整数を割り当ててから、ランダムサンプリングを選択するだけで、0から1000の範囲を指定することを考えていました。問題は、いつ更新され、いつ挿入されるかわからないことです。したがって、新しいエントリの場合にのみ、挿入する値をインクリメントします。だから私は多分それをチェックするためにgetLastErrorを使うことを考えていますか?
これを行うにはもっと良い方法があるように感じます。
助言がありますか?
ありがとう、