# models.py
from django.db import models
class Person(models.Model):
first_name = models.CharField(max_length=30)
last_name = models.CharField(max_length=30)
text_blob = models.CharField(max_length=50000)
# tasks.py
import celery
@celery.task
def my_task(person):
# example operation: does something to person
# needs only a few of the attributes of person
# and not the entire bulky record
person.first_name = person.first_name.title()
person.last_name = person.last_name.title()
person.save()
私のアプリケーションのどこかに、次のようなものがあります。
from models import Person
from tasks import my_task
import celery
g = celery.group([my_task.s(p) for p in Person.objects.all()])
g.apply_async()
- セロリはpを漬けて労働者に送りますよね?
- ワーカーが複数のマシンで実行されている場合、personオブジェクト全体(主に必要とされないかさばるtext_blobとともに)がネットワーク経由で送信されますか?それを回避する方法はありますか?
複数のマシンで実行されているワーカーにPersonレコードを効率的かつ均等に配布するにはどうすればよいですか?
これはより良いアイデアでしょうか?Personが数百万のレコードを持っている場合、それはデータベースを圧倒しませんか?
# tasks.py import celery from models import Person @celery.task def my_task(person_pk): # example operation that does not need text_blob person = Person.objects.get(pk=person_pk) person.first_name = person.first_name.title() person.last_name = person.last_name.title() person.save() #In my application somewhere from models import Person from tasks import my_task import celery g = celery.group([my_task.s(p.pk) for p in Person.objects.all()]) g.apply_async()