Github Data Challenge へのエントリに取り組み、一連の PushEvents を分析しようとしていますが、奇妙な (?) 結果が得られます。
users = Hash.new(0)
(0..23).each do |hour|
gz = open("http://data.githubarchive.org/2013-04-01-#{hour}.json.gz")
js = Zlib::GzipReader.new(gz).read
Yajl::Parser.parse(js) do |event|
if event["type"] == "PushEvent" && event["actor_attributes"] && event["actor_attributes"]["login"]
users[event["actor_attributes"]["login"]] += 1
end
end
end
このスクリプトは正常に機能しますが、人によって行われたほとんどのコミットを見ると
users.values.max
誰かが 1 日で 7,000 件以上のコミットを行っているのを見ました。私が通り抜けて印刷するとき
event["payload"]["shas"]
印刷された結果はすべて基本的に同じです。
585a2f02f36da9ee0625a42aa2d5e98836c8a2de
danil@orionet.ru
Notes added by 'git notes add'
Jenkins
true
PushEvent に関連付けられたコミット メッセージは「'git notes add' によって追加されたメモ」であると推測されますが、これは正しいように見えますか? それとも、ここでいくつかのデータを読み違えていますか?