問題タブ [github-archive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
99 参照

ruby - GitHub アーカイブ - 範囲を含むデータの取得に関する問題

[GitHub アーカイブ]: https://www.githubarchive.org/からデータを取得しようとしていますが、範囲を追加するとデータを取得できません。http://data.githubarchive.org/2015-01-01-15.json.gzを使用すると機能しますが、 http://を使用すると `open_http': 404 Not Found (OpenURI::HTTPError) メッセージが表示されますdata.githubarchive.org/2015-01-01- {0..23}.json.gz.

curl http://data.githubarchive.org/2015-01-01- {0..23}.json.gz を使用するとうまくいくようです。

基本的に、私の目標は、特定の時間範囲で上位 42 の最もアクティブなリポジトリを取得するプログラムを作成することです。

これが私のコードです。API の使い方が間違っているか、コードに問題があることをお知らせください。

0 投票する
2 に答える
422 参照

google-bigquery - コミット数順に github プロジェクトを検索するには?

BigQuery と GithubArchive を試してみることを考えていましたが、コードまたはプロジェクト内の用語を検索し、コミット数の降順で結果を並べ替えるクエリを作成する方法がわかりません。

ヒントをありがとう

0 投票する
2 に答える
475 参照

github - BigQuery から github タイムライン データを取得する方法

から GitHub タイムラインにアクセスできませんBigQuery

次のクエリを使用していました。

SELECT repository_name, actor_attributes_company, payload_ref_type, payload_action, type, created_at FROM githubarchive:github.timeline WHERE repository_organization = 'foo' and created_at > '2014-07-01'

そして、すべてがうまく機能していました。現在、githubarchive:github.timeline テーブルは利用できなくなっているようです。私は周りを見回しており、別のテーブルを見つけました:

SELECT repository_name, actor_attributes_company, payload_ref_type, payload_action, type, created_at FROM publicdata:samples.github_timeline WHERE repository_organization = 'foo' and created_at > '2014-07-01'

このクエリは機能しますが、ゼロ行が返されます。created_at 制限を削除すると機能しましたが、2012 年から数行しか返されなかったため、これは単なるサンプル データのようです。

GitHub からライブ タイムライン データを取得する方法を知っている人はいますか?

0 投票する
2 に答える
729 参照

github - Github アーカイブ データを介して言語の人気を測定する方法は?

私は次の方法でプログラミング言語の人気を測定しようとしています:

  1. と組み合わせたレポの星の数...
  2. リポジトリで使用されるプログラミング言語と...
  3. 各言語のコードの合計バイト数 (一部の言語はより詳細/より詳細ではないことを認識)

便利なことに、Github Archive によって提供され、BigQuery によってホストされている大量の Github データがあります。唯一の問題は、Github アーカイブのさまざまなイベント タイプのペイロードで「言語」が利用できないことです。

Github アーカイブ データに言語が入力されている可能性があるかどうか、およびその場所を見つけようとして実行している BigQuery クエリを次に示します。

この方法で Github アーカイブ データを利用できるかどうか、またどのように利用できるかについて、誰かが洞察を提供してもらえますか? それとも、他のアプローチを追求する必要がありますか? BigQuery には github_repos パブリック データセットもあることがわかりました。これにはいくつかの言語指標が含まれていますが、言語指標は常に終わっているようです。最終的には、何らかの月次指標 (つまり、特定の月の「アクティブな」リポジトリ、最も人気のある言語) を取得したいと考えています。

どんなアドバイスでも大歓迎です!