私は現在、Google App Engine で Python の Web アプリケーションを構築して、フォームの競馬データを収集しています。基本的なデータ構造は、 Course has many Meetings many Races many Horses has a Jockey and a Trainer です。これまでのところ、次のモデルを取得しています (簡潔にするためにフィールドの数を減らしています)。
class Course(db.Model):
course_number = db.IntegerProperty() # course id (third party)
course_description = db.StringProperty() # course name
class Meeting(db.Model):
course = db.ReferenceProperty(Course) # reference to course
meeting_number = db.IntegerProperty() # lifetime meeting number for course
meeting_date = db.DateProperty() # meeting date
class Race(db.Model):
meeting = db.ReferenceProperty(Meeting) # reference to meeting
race_number = db.IntegerProperty() # eg 1 for 1st race of meeting
race_name = db.StringProperty() # race name
time_of_race = db.TimeProperty() # race time
馬、トレーナー、ジョッキーのデータをデータ ストアに保存する方法がわかりません。
私のアプリケーションは、たとえば過去 2 年間のデータを収集します。このため、馬、調教師、騎手に関する関連結果情報を保存します。特定の馬の結果に関する情報は、その時点で調教師と騎手で同じです。ただし、時間の経過とともに、馬は異なるトレーナーと異なるジョッキーを持つことができます.
馬、騎手、調教師のいずれかの過去 10 レースの結果を分析する必要があることに気付いたとき、私の主な脳の痛みが来ています。結果が英国のレース以外で発生したため (データはまだ利用可能です)、または完全なレースの保存を開始する日付より前に発生したため、保存されない可能性がある結果。
私がこれに対応できるように、馬、騎手、トレーナーの結果の保存を最適化する方法について誰かが光を当てることができますか?
データのソース: http://form.horseracing.betfair.com/timeform 必要なすべてのデータは、JSON リクエストを介して簡単にアクセスできます。