Kiva には、http://build.kiva.orgで利用可能な API があります。
また、API からの匿名化された (可能な限り) データのスナップショットも時折あります。現在、これらのスナップショットを定期的に、たとえば週に 1 回更新するように取り組んでいます。それらは合計で大きく、350MB の圧縮、> 1GB の非圧縮です。ただし、それらは何百もの JSON ファイルで構成されているため、変更を単にプルダウンするという点で git の恩恵を受けることができます。
スナップショットを Git と Github に移動して、それらのホスティングを利用し、スナップショットの更新をより高速に取得したいと考えています。実際、現在のスナップショットのみのコミットを 1 つここに掲載しました: https://github.com/coderintherye/kivaloans
ただし、時間をかけてデータをつなぎ合わせるために、過去の履歴を簡単に取得したくないため、git履歴を保持したくないという要望があります。もちろん、その理由は、私たちにはユーザーのプライバシーを保護する法的責任があるからであり、データをどれだけ匿名化しようとしても、十分なデータをまとめれば、ユーザーの活動を特定できる可能性があるという現実的な期待があります。 Netflix コンテストで起こったことなどのグループまたは個人へ: http://www.wired.com/threatlevel/2010/03/netflix-cancels-contest/
履歴を保持せずに、Git を使用してデータを提供する方法はありますか? 私たちが検討しているオプションの 1 つは git を使用することですが、rebase -i を使用して以前のコミットを破棄します。しかし、Git から利益を得るためには、少なくとも以前のコミットを保持する必要があると思います。もちろん、定期的にプルしていない人は、あまり利益を得られません。参照への古いコミット (または、そう思いますか?)
それとも、このようにデータを利用して良き市民になろうとする期待は、不当な期待でしょうか? もしそうなら、私たちはその考えを完全に放棄することができます.