5 分ごとに実行され、mongodb コレクションから次の 100 レコードを処理するスケジューラ ジョブが必要です。最初に挿入されたドキュメントから開始する必要があります。したがって、最初の実行では、データを昇順で並べ替えて、最初の 100 個のドキュメントを取得できます。しかし、連続実行の場合、最後に処理されたドキュメントのオブジェクト ID を示す次の 100 レコードを取得するにはどうすればよいですか? (ここでオブジェクトIDを使用する方法がわかりません。これは、さまざまなパラメーターを持つ生成文字列であるためです...他のIDが定義されていません。)
これが大規模なデータ セットの mongodb からレコードを取得するのに適していない場合は、より良い方法を提案してください。
各ドキュメントは次のようになります。
{ "_id" : { "$oid" : "51ff17c8e4b02969f18e72bb"} , "source_of_info" : "somesource" ,
"entityinfo" : [ { "user" : "Alfredo Vela Zancada" , "social_network_entity_id" :
364221775325822977 , "text" : "blah blah blah" , "created_at" : { "$date" : "2013-08-
05T03:10:12.000Z"}}] , "relatedURLs" : [ { "url" : "http://t.co/swqP3FYQt5"
,"expanded_url" : "http://ow.ly/nCkIS"}]}
ありがとう。