「サンプル」コレクションには 1 億件のレコードがあります。すべての個別のユーザー名「user.screen_name」を含む別のコレクションが必要です
私のmongodbデータベースの「サンプル」コレクションには、次の構造があります。
{
"_id" : ObjectId("515af34297c2f607b822a54b"),
"text" : "random text goes here",
"user" :
{
"id" : 972863366,
"screen_name" : "xname",
"verified" : false,
"time_zone" : "Amsterdam",
}
}
「distinct('user.id).length」などを試すと、次のエラーが発生します。
"errmsg" : "exception: distinct too big, 16mb cap",
「サンプル」コレクション内の個別のユーザーの {"user_name": "name"} のみを含む別のコレクションを作成する効率的な方法が必要です。そのため、この新しいデータベースのサイズを照会して、個別のユーザー数を取得できます。(そして将来のさらなる分析のために)